CVS-zu-NIST-Konverter
Wandeln Sie Ihre cvs-Dateien online & kostenlos in nist um
cvs
nist
Wie man CVS in NIST konvertiert
Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.
Wählen Sie nist oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)
Lassen Sie die Datei konvertieren und Sie können Ihre nist-Datei direkt danach herunterladen
Über die Formate
CVS ist eine Telefonie-Audiokodierung, die auf Continuously Variable Slope Delta Modulation basiert. Die Sprache wird über ein 1-Bit-Delta-Schema dargestellt, bei dem die Schrittgrösse sich adaptiv an die Eingangsamplitude anpasst. Von der CCITT (heute ITU-T) in den 1970er Jahren im Rahmen von Standards entwickelt, kodiert CVS durch Vergleich jedes Samples mit dem vorhergehenden und Ausgabe eines einzelnen Bits — auf oder ab — wobei die Schrittgrösse basierend auf aktuellen Bitmustern angepasst wird. Dies ergibt extrem niedrige Bitraten, typischerweise 16 kbps bei 8 kHz Abtastung, effizient für schmalbandige Sprache über eingeschränkte Kanäle. CVS-Dateien speichern vorzeichenbehaftete delta-kodierte Daten und werden üblicherweise mit Tools wie SoX verarbeitet. Ein wesentlicher Vorteil ist die Bandbreiteneffizienz: Der 1-Bit-pro-Sample-Ansatz erfordert minimale Übertragungskapazität, unverzichtbar für militärische Funkverbindungen und frühe digitale Telefoninfrastruktur. Der adaptive Schrittweiten-Mechanismus verhindert zudem Übersteürungsverzerrungen bei schnell wechselnden Signalen, während das Granularrauschen in ruhigen Passagen akzeptabel bleibt. Obwohl moderne Breitband-Codecs CVS abgelöst haben, besitzt es historische Bedeutung und wird in Legacy-Telefonie- und eingebetteten Kommunikationsgeräten weiterhin verwendet.
NIST SPHERE (SPeech HEader REsources) ist ein spezialisiertes Audiodateiformat, das vom National Institute of Standards and Technology für die Sprachforschung entwickelt wurde, insbesondere für DARPA-geförderte Projekte. Das Format umhüllt rohe Audiosamples mit einem strukturierten ASCII-Header, der Metadaten wie Abtastrate, Kanalanzahl, Kodierungstyp, Sprecherdemografie und Transkriptionsannotationen enthält — ideal für die Verteilung von Sprachkorpora. NIST-Dateien speichern typischerweise unkomprimiertes PCM oder Mu-Law-Audio bei Telefonie-Abtastraten (8 kHz oder 16 kHz), obwohl der Container flexibel genug für verschiedene Kodierungen ist. Ein wesentlicher Vorteil ist der reichhaltige, selbstbeschreibende Header, der es Forschern ermöglicht, detaillierte Korpus-Metadaten direkt in die Datei einzubetten und so Begleitdateien überflüssig zu machen. SPHERE hat sich zudem als De-facto-Standard für bedeutende Sprachdatenbanken wie TIMIT, Switchboard und das Fisher-Korpus etabliert und genießt breite Anerkennung in akademischen und staatlichen Laboren. Die offene Spezifikation und die Verfügbarkeit von Kommandozeilentools (sphere, h_strip, w_decode) machen es unkompliziert, diese Dateien in Sprachverarbeitungspipelines programmatisch zu konvertieren, zu inspizieren und zu verarbeiten.