HTK-zu-MAUD-Konverter

Wandeln Sie Ihre htk-Dateien online & kostenlos in maud um

Dateien hierhin und ablegen. 1 GB maximale dateigröße oder Registrieren
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Wie man HTK in MAUD konvertiert

1

Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.

2

Wählen Sie maud oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)

3

Lassen Sie die Datei konvertieren und Sie können Ihre maud-Datei direkt danach herunterladen

Über die Formate

HTK ist der native Wellenform-Container des Hidden Markov Model Toolkit, einer Software-Suite, die am Engineering Department der Universität Cambridge für die Spracherkennungsforschung entwickelt wurde. Erstmals 1993 veröffentlicht, wurde HTK rasch zu einer Referenzplattform in computerlinguistischen Laboren weltweit, und sein Dateiformat folgte diesem Trend. Jede Datei speichert eine Sequenz von Parametervektoren oder Rohsamples mit einem vorangestellten 12-Byte-Header, der die Anzahl der Frames, die Frame-Periode in 100-ns-Einheiten, die Bytezahl pro Frame und einen Typcode angibt — die Optionen reichen von Wellenform-PCM bis zu Mel-Frequenz-Cepstralköffizienten und Filterbankenenergien. Diese Vielseitigkeit ermöglicht es einem einzigen Container, sowohl Quellaudio als auch extrahierte Features zu tragen, ohne den Parser zu wechseln. Der bewusst minimale Header vermeidet Alignment-Padding oder optionale Chunks und macht das Format trivial lesbar in C, Python oder MATLAB mit wenigen Zeilen binärer E/A. Drei Vorteile unterstreichen die anhaltende Relevanz von HTK: enge Integration mit der HTK-Trainings- und Erkennungspipeline, deterministisches Byte-Layout ohne Parser-Mehrdeutigkeiten und weite Verbreitung in akademischen Korpora.
Erstveröffentlichung: 1993
MAUD ist ein Audioformat, das von MacroSystem für die Commodore-Amiga-Plattform entwickelt wurde und Anfang der 1990er Jahre als Teil ihrer Digital-Video- und Audio-Produktionstools erschien. Basierend auf der Amiga-IFF-Chunk-Architektur (Interchange File Format) organisiert MAUD Daten in klar abgegrenzten Chunks — MHDR für den Header, MDAT für Sampledaten und optionale Annotations-Chunks für Metadaten. Das Format unterstützt Mono- und Stereo-Layouts mit Bittiefen von 8 oder 16 Bit und Abtastraten bis 48 kHz, was auf der Amiga-Hardware professionellen Spezifikationen entsprach. Sowohl vorzeichenbehaftetes lineares PCM als auch A-Law-/Mu-Law-Kodierungen stehen zur Verfügung und bieten die Wahl zwischen Klangtreue und Dateigröße. MAUD wurde primär in der Amiga-Videoproduktions-Community eingesetzt, wo MacroSystem-Retina- und VLab-Motion-Karten synchronisiertes Audio erforderten, das das Standard-8SVX-Format nicht liefern konnte. Konvertierungsunterstützung besteht heute durch SoX und libsndfile, sodass Vintage-Amiga-Produktionen wiederherstellbar bleiben. Drei markante Vorteile stechen hervor: die saubere IFF-basierte Struktur, die jeder Chunk-fähige Parser navigieren kann, die 16-Bit-Stereo-Fähigkeit — dem typischen Amiga-Audio voraus — und der geringe Overhead, der maximale CPU-Ressourcen für Videorendering freihält.
Erstveröffentlichung: 1992