SHN-zu-HTK-Konverter
Wandeln Sie Ihre shn-Dateien online & kostenlos in htk um
shn
htk
Wie man SHN in HTK konvertiert
Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.
Wählen Sie htk oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)
Lassen Sie die Datei konvertieren und Sie können Ihre htk-Datei direkt danach herunterladen
Über die Formate
Shorten (SHN) ist ein verlustfreier Audiokompressionscodec, der 1993 von Tony Robinson bei SoftSound) entwickelt wurde und damit einer der frühesten praktisch einsetzbaren Lossless-Kompressoren ist. Der Algorithmus nutzt lineare Vorhersage, um jedes Sample aus seinen Vorgängern zu schätzen, und kodiert die Residün dann mit Huffman- oder Golomb-Rice-Codes. Kompressionsraten liegen typischerweise zwischen 2:1 und 3:1, mit der Garantie, dass die dekodierte Ausgabe bitidentisch mit dem Original ist. Shorten erlangte in den späten 1990er Jahren kulturelle Bedeutung als bevorzugtes Format für den Tausch von Live-Konzertaufnahmen im Internet — Communities wie etree.org bauten ganze Verteilungsnetzwerke um SHN-Dateien auf, und Bands wie die Grateful Dead und Phish duldeten die Praxis stillschweigend. Ein Vorteil war die Einfachheit des Formats: Kodierung und Dekodierung liefen schnell, selbst auf bescheidener Pentium-Hardware. Eine weitere Stärke war die deterministische Ausgabe — der gleiche Input erzeugte stets die gleichen Bytes, was Prüfsummen zur zuverlässigen Integritätsüberprüfung unter Tausenden von Tauschpartnern machte. Obwohl FLAC Shorten schliesslich mit besserer Kompression, Seeking-Unterstützung und eingebetteten Metadaten ablöste, besitzt SHN weiterhin historische Bedeutung, und umfangreiche Live-Musik-Archive im Format zirkulieren bis heute.
HTK ist der native Wellenform-Container des Hidden Markov Model Toolkit, einer Software-Suite, die am Engineering Department der Universität Cambridge für die Spracherkennungsforschung entwickelt wurde. Erstmals 1993 veröffentlicht, wurde HTK rasch zu einer Referenzplattform in computerlinguistischen Laboren weltweit, und sein Dateiformat folgte diesem Trend. Jede Datei speichert eine Sequenz von Parametervektoren oder Rohsamples mit einem vorangestellten 12-Byte-Header, der die Anzahl der Frames, die Frame-Periode in 100-ns-Einheiten, die Bytezahl pro Frame und einen Typcode angibt — die Optionen reichen von Wellenform-PCM bis zu Mel-Frequenz-Cepstralköffizienten und Filterbankenenergien. Diese Vielseitigkeit ermöglicht es einem einzigen Container, sowohl Quellaudio als auch extrahierte Features zu tragen, ohne den Parser zu wechseln. Der bewusst minimale Header vermeidet Alignment-Padding oder optionale Chunks und macht das Format trivial lesbar in C, Python oder MATLAB mit wenigen Zeilen binärer E/A. Drei Vorteile unterstreichen die anhaltende Relevanz von HTK: enge Integration mit der HTK-Trainings- und Erkennungspipeline, deterministisches Byte-Layout ohne Parser-Mehrdeutigkeiten und weite Verbreitung in akademischen Korpora.