HTK-zu-SPX-Konverter

Wandeln Sie Ihre htk-Dateien online & kostenlos in spx um

Dateien hierhin und ablegen. 1 GB maximale dateigröße oder Registrieren
in

Einstellungen

Stellen Sie die Gesamt-Audio-Bitrate für Speex ein. Speex wurde für die Codierung menschlicher Sprache entwickelt und erreicht Transparenz bei extrem niedriger Bitrate mit einer maximalen Bitrate von 44 kbps.
Stellen Sie die Anzahl der Audiokanäle ein. Diese Einstellung ist am nützlichsten, wenn Kanäle heruntergemischt werden (z. B. von 5.1 auf Stereo).
Stellen Sie die Abtastrate des Audios ein. Musik mit einem vollen Spektrum (20 Hz — 20 kHz) erfordert Werte von nicht weniger als 44.1 kHz, um Transparenz zu erreichen. Weitere Informationen finden Sie im wiki.

htk

HTK ist der native Wellenform-Container des Hidden Markov Model Toolkit, einer Software-Suite, die am Engineering Department der Universität Cambridge für die Spracherkennungsforschung entwickelt wurde. Erstmals 1993 veröffentlicht, wurde HTK rasch zu einer Referenzplattform in computerlinguistischen Laboren weltweit, und sein Dateiformat folgte diesem Trend. Jede Datei speichert eine Sequenz von Parametervektoren oder Rohsamples mit einem vorangestellten 12-Byte-Header, der die Anzahl der Frames, die Frame-Periode in 100-ns-Einheiten, die Bytezahl pro Frame und einen Typcode angibt — die Optionen reichen von Wellenform-PCM bis zu Mel-Frequenz-Cepstralköffizienten und Filterbankenenergien. Diese Vielseitigkeit ermöglicht es einem einzigen Container, sowohl Quellaudio als auch extrahierte Features zu tragen, ohne den Parser zu wechseln. Der bewusst minimale Header vermeidet Alignment-Padding oder optionale Chunks und macht das Format trivial lesbar in C, Python oder MATLAB mit wenigen Zeilen binärer E/A. Drei Vorteile unterstreichen die anhaltende Relevanz von HTK: enge Integration mit der HTK-Trainings- und Erkennungspipeline, deterministisches Byte-Layout ohne Parser-Mehrdeutigkeiten und weite Verbreitung in akademischen Korpora.
mehr lesen

spx

Speex ist ein quelloffener Audiocodec, der gezielt für Sprachkompression entwickelt wurde — erdacht von Jean-Marc Valin unter der Xiph.Org Foundation. Erstmals im Oktober 2002 veröffentlicht, zielt er auf Voice-over-IP, Konferenzen und jedes Szenario, in dem gesprochenes Wort effizient über ein Netzwerk übertragen werden muss. SPX-Dateien verpacken Speex-kodiertes Audio in einem Ogg-Container und kombinieren so die Sprachoptimierung des Codecs mit den Streaming-Fähigkeiten von Ogg. Drei Abtastraten werden unterstützt — Schmalband bei 8 kHz, Breitband bei 16 kHz und Ultra-Breitband bei 32 kHz — zusammen mit variabler Bitratenkodierung, die sich in Echtzeit an die Sprachkomplexität anpasst. Ein herausragender Vorteil ist seine patentfreie, BSD-lizenzierte Natur, die es Entwicklern ermöglichte, ihn frei in kommerzielle und Open-Source-Produkte einzubetten. Speex bringt zudem akustische Echounterdrückung, Rauschunterdrückung und automatische Verstärkungsregelung mit — Features, die konkurrierende Codecs typischerweise an externe Bibliotheken delegieren. Obwohl die Entwickler seit 2012 offiziell Opus als Nachfolger empfehlen, bleibt Speex in Legacy-VoIP-Systemen, archivierten Aufnahmen und eingebetteten Geräten im Einsatz, wo sein leichtgewichtiger Decoder-Footprint geschätzt wird.
mehr lesen
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Wie man HTK in SPX konvertiert

1

Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.

2

Wählen Sie spx oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)

3

Lassen Sie die Datei konvertieren und Sie können Ihre spx-Datei direkt danach herunterladen

Über die Formate

HTK ist der native Wellenform-Container des Hidden Markov Model Toolkit, einer Software-Suite, die am Engineering Department der Universität Cambridge für die Spracherkennungsforschung entwickelt wurde. Erstmals 1993 veröffentlicht, wurde HTK rasch zu einer Referenzplattform in computerlinguistischen Laboren weltweit, und sein Dateiformat folgte diesem Trend. Jede Datei speichert eine Sequenz von Parametervektoren oder Rohsamples mit einem vorangestellten 12-Byte-Header, der die Anzahl der Frames, die Frame-Periode in 100-ns-Einheiten, die Bytezahl pro Frame und einen Typcode angibt — die Optionen reichen von Wellenform-PCM bis zu Mel-Frequenz-Cepstralköffizienten und Filterbankenenergien. Diese Vielseitigkeit ermöglicht es einem einzigen Container, sowohl Quellaudio als auch extrahierte Features zu tragen, ohne den Parser zu wechseln. Der bewusst minimale Header vermeidet Alignment-Padding oder optionale Chunks und macht das Format trivial lesbar in C, Python oder MATLAB mit wenigen Zeilen binärer E/A. Drei Vorteile unterstreichen die anhaltende Relevanz von HTK: enge Integration mit der HTK-Trainings- und Erkennungspipeline, deterministisches Byte-Layout ohne Parser-Mehrdeutigkeiten und weite Verbreitung in akademischen Korpora.
Erstveröffentlichung: 1993
Speex ist ein quelloffener Audiocodec, der gezielt für Sprachkompression entwickelt wurde — erdacht von Jean-Marc Valin unter der Xiph.Org Foundation. Erstmals im Oktober 2002 veröffentlicht, zielt er auf Voice-over-IP, Konferenzen und jedes Szenario, in dem gesprochenes Wort effizient über ein Netzwerk übertragen werden muss. SPX-Dateien verpacken Speex-kodiertes Audio in einem Ogg-Container und kombinieren so die Sprachoptimierung des Codecs mit den Streaming-Fähigkeiten von Ogg. Drei Abtastraten werden unterstützt — Schmalband bei 8 kHz, Breitband bei 16 kHz und Ultra-Breitband bei 32 kHz — zusammen mit variabler Bitratenkodierung, die sich in Echtzeit an die Sprachkomplexität anpasst. Ein herausragender Vorteil ist seine patentfreie, BSD-lizenzierte Natur, die es Entwicklern ermöglichte, ihn frei in kommerzielle und Open-Source-Produkte einzubetten. Speex bringt zudem akustische Echounterdrückung, Rauschunterdrückung und automatische Verstärkungsregelung mit — Features, die konkurrierende Codecs typischerweise an externe Bibliotheken delegieren. Obwohl die Entwickler seit 2012 offiziell Opus als Nachfolger empfehlen, bleibt Speex in Legacy-VoIP-Systemen, archivierten Aufnahmen und eingebetteten Geräten im Einsatz, wo sein leichtgewichtiger Decoder-Footprint geschätzt wird.
Entwickler: Xiph.Org Foundation
Erstveröffentlichung: 15. Oktober 2002