NIST-zu-CVSD-Konverter

Wandeln Sie Ihre nist-Dateien online & kostenlos in cvsd um

Dateien hierhin und ablegen. 1 GB maximale dateigröße oder Registrieren
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Wie man NIST in CVSD konvertiert

1

Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.

2

Wählen Sie cvsd oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)

3

Lassen Sie die Datei konvertieren und Sie können Ihre cvsd-Datei direkt danach herunterladen

Über die Formate

NIST SPHERE (SPeech HEader REsources) ist ein spezialisiertes Audiodateiformat, das vom National Institute of Standards and Technology für die Sprachforschung entwickelt wurde, insbesondere für DARPA-geförderte Projekte. Das Format umhüllt rohe Audiosamples mit einem strukturierten ASCII-Header, der Metadaten wie Abtastrate, Kanalanzahl, Kodierungstyp, Sprecherdemografie und Transkriptionsannotationen enthält — ideal für die Verteilung von Sprachkorpora. NIST-Dateien speichern typischerweise unkomprimiertes PCM oder Mu-Law-Audio bei Telefonie-Abtastraten (8 kHz oder 16 kHz), obwohl der Container flexibel genug für verschiedene Kodierungen ist. Ein wesentlicher Vorteil ist der reichhaltige, selbstbeschreibende Header, der es Forschern ermöglicht, detaillierte Korpus-Metadaten direkt in die Datei einzubetten und so Begleitdateien überflüssig zu machen. SPHERE hat sich zudem als De-facto-Standard für bedeutende Sprachdatenbanken wie TIMIT, Switchboard und das Fisher-Korpus etabliert und genießt breite Anerkennung in akademischen und staatlichen Laboren. Die offene Spezifikation und die Verfügbarkeit von Kommandozeilentools (sphere, h_strip, w_decode) machen es unkompliziert, diese Dateien in Sprachverarbeitungspipelines programmatisch zu konvertieren, zu inspizieren und zu verarbeiten.
Erstveröffentlichung: 1990
CVSD (Continuously Variable Slope Delta Modulation) ist ein Sprachdigitalisierungsverfahren, das in den 1970er Jahren von der NATO und der CCITT für militärische und Telefonieanwendungen standardisiert wurde. Es kodiert Differenzen zwischen aufeinanderfolgenden Samples als einzelnes Bit — 1, wenn das aktuelle Sample die Vorhersage übersteigt, sonst 0 — während ein Silbenkompandierungsfilter die Schrittweite anpasst, indem er Folgen identischer Bits überwacht. Mit 16 bis 64 kbps balanciert CVSD Sprachverständlichkeit gegen Bandbreite und war die bevorzugte Kodierung für gesicherte Militärverbindungen und taktische Funksysteme. Der Bitstrom kann mit einfacher Hardware dekodiert werden, die ursprünglich in spezialisierte integrierte Schaltkreise eingebaut war. Ein Vorteil ist die Implementierungseinfachheit — Encoder und Decoder benötigen minimale Ressourcen und ermöglichen Echtzeitverarbeitung auf stromsparender eingebetteter Hardware. Robustheit unter verrauschten Bedingungen ist eine weitere Stärke, da einzelne Bitfehler nur lokale Samples betreffen statt ganze Frames zu beschädigen. SoX bietet Software-Encoding- und Decoding-Unterstützung, sodass moderne Systeme historische CVSD-Aufnahmen aus Militärarchiven und alter Telekommunikationsinfrastruktur verarbeiten können.
Entwickler: CCITT / NATO
Erstveröffentlichung: 1970