NIST-zu-CVU-Konverter

Wandeln Sie Ihre nist-Dateien online & kostenlos in cvu um

Dateien hierhin und ablegen. 1 GB maximale dateigröße oder Registrieren
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Wie man NIST in CVU konvertiert

1

Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.

2

Wählen Sie cvu oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)

3

Lassen Sie die Datei konvertieren und Sie können Ihre cvu-Datei direkt danach herunterladen

Über die Formate

NIST SPHERE (SPeech HEader REsources) ist ein spezialisiertes Audiodateiformat, das vom National Institute of Standards and Technology für die Sprachforschung entwickelt wurde, insbesondere für DARPA-geförderte Projekte. Das Format umhüllt rohe Audiosamples mit einem strukturierten ASCII-Header, der Metadaten wie Abtastrate, Kanalanzahl, Kodierungstyp, Sprecherdemografie und Transkriptionsannotationen enthält — ideal für die Verteilung von Sprachkorpora. NIST-Dateien speichern typischerweise unkomprimiertes PCM oder Mu-Law-Audio bei Telefonie-Abtastraten (8 kHz oder 16 kHz), obwohl der Container flexibel genug für verschiedene Kodierungen ist. Ein wesentlicher Vorteil ist der reichhaltige, selbstbeschreibende Header, der es Forschern ermöglicht, detaillierte Korpus-Metadaten direkt in die Datei einzubetten und so Begleitdateien überflüssig zu machen. SPHERE hat sich zudem als De-facto-Standard für bedeutende Sprachdatenbanken wie TIMIT, Switchboard und das Fisher-Korpus etabliert und genießt breite Anerkennung in akademischen und staatlichen Laboren. Die offene Spezifikation und die Verfügbarkeit von Kommandozeilentools (sphere, h_strip, w_decode) machen es unkompliziert, diese Dateien in Sprachverarbeitungspipelines programmatisch zu konvertieren, zu inspizieren und zu verarbeiten.
Erstveröffentlichung: 1990
CVU ist eine vorzeichenlose Variante des CVS-Telefonie-Audioformats und unterscheidet sich in der Art, wie delta-kodierte Werte im Binärstrom dargestellt werden. Während CVS die Slope-Delta-Werte als vorzeichenbehaftete Grössen speichert, behandelt CVU sie als vorzeichenlos und verschiebt damit die numerische Interpretation jedes Samples. Beide teilen die zugrunde liegende CVSD-Modulationstechnik — adaptive 1-Bit-Delta-Kodierung, bei der die Schrittweite je nach aktüllem Bitmuster variiert — und arbeiten mit vergleichbaren Raten, typischerweise 16 kbps für Schmalbandsprache bei 8 kHz. Der Unterschied zwischen vorzeichenbehaftet und vorzeichenlos ist beim Decoder relevant, da die korrekte Interpretation die ordnungsgemäße Wellenformrekonstruktion bestimmt. CVU-Dateien finden sich in Telefonie- und eingebetteten Kommunikationsumgebungen, deren Hardware die vorzeichenlose Konvention übernahm. Ein praktischer Vorteil liegt in der unkomplizierten Anbindung an Systeme mit nativer vorzeichenloser Arithmetik, wodurch Vorzeichenerweiterungen im Decoder entfallen. Wie sein vorzeichenbehaftetes Pendant erreicht CVU extreme Bandbreiteneffizienz und komprimiert Sprache in kompakte Bitstroms für eingeschränkte Verbindungen. SoX unterstützt CVU und bietet einen zuverlässigen Weg, diese speziellen Telefonieaufnahmen in moderne Formate zu konvertieren.
Entwickler: CCITT / ITU-T
Erstveröffentlichung: 1970