AVR-zu-HTK-Konverter
Wandeln Sie Ihre avr-Dateien online & kostenlos in htk um
avr
htk
Wie man AVR in HTK konvertiert
Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.
Wählen Sie htk oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)
Lassen Sie die Datei konvertieren und Sie können Ihre htk-Datei direkt danach herunterladen
Über die Formate
AVR (Audio Visual Research) ist ein Audioformat, das um 1989 auf dem Apple Macintosh entstand und von der Firma Audio Visual Research für ihre Bearbeitungs- und Synthesetools entwickelt wurde. Es speichert rohe Audiosamples mit einem Header fester Länge, der Abtastrate, Bittiefe (8 oder 16 Bit), Kanalkonfiguration und Loop-Point-Marker enthält. Im Gegensatz zu komplexen Container-Formaten verwendet AVR eine flache Binärstruktur ohne Kompression und bewahrt die volle Wellenformqualität auf Kosten grösserer Dateien. Das Format diente professionellen Macintosh-Audio-Workstations in den späten 1980er und frühen 1990er Jahren, als die Mac-Plattform im kreativen Bereich dominierte. Ein Vorteil ist die unkomprimierte Speicherung, die keinerlei Artefakte erzeugt und perfekte Signalintegrität bei der Bearbeitung gewährleistet. Native Loop-Marker stellen ein weiteres Feature dar und ermöglichen Sounddesignern, nahtlose Wiederholungspunkte innerhalb der Datei zu definieren — für die damalige samplebasierte Musikproduktion vorausschaünd. Tools wie SoX pflegen die AVR-Unterstützung weiter und stellen sicher, dass Archivare auf diese historischen Aufnahmen zugreifen und sie konvertieren können. Obwohl von WAV und AIFF verdrängt, bleibt AVR ein bemerkenswertes Stück früherer digitaler Audiogeschichte.
HTK ist der native Wellenform-Container des Hidden Markov Model Toolkit, einer Software-Suite, die am Engineering Department der Universität Cambridge für die Spracherkennungsforschung entwickelt wurde. Erstmals 1993 veröffentlicht, wurde HTK rasch zu einer Referenzplattform in computerlinguistischen Laboren weltweit, und sein Dateiformat folgte diesem Trend. Jede Datei speichert eine Sequenz von Parametervektoren oder Rohsamples mit einem vorangestellten 12-Byte-Header, der die Anzahl der Frames, die Frame-Periode in 100-ns-Einheiten, die Bytezahl pro Frame und einen Typcode angibt — die Optionen reichen von Wellenform-PCM bis zu Mel-Frequenz-Cepstralköffizienten und Filterbankenenergien. Diese Vielseitigkeit ermöglicht es einem einzigen Container, sowohl Quellaudio als auch extrahierte Features zu tragen, ohne den Parser zu wechseln. Der bewusst minimale Header vermeidet Alignment-Padding oder optionale Chunks und macht das Format trivial lesbar in C, Python oder MATLAB mit wenigen Zeilen binärer E/A. Drei Vorteile unterstreichen die anhaltende Relevanz von HTK: enge Integration mit der HTK-Trainings- und Erkennungspipeline, deterministisches Byte-Layout ohne Parser-Mehrdeutigkeiten und weite Verbreitung in akademischen Korpora.