Konwerter plików SPX do HTK

Konwertuj swoje pliki w formacie spx do formatu htk przez Internet i bezpłatnie

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Jak przekonwertować plik w formacie SPX do formatu HTK

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.

O formatach

Speex to otwartorodlowy kodek audio celowo zaprojektowany do kompresji mowy, opracowany przez Jean-Marc Valina pod auspicjami Xiph.Org Foundation. Po raz pierwszy wydany w pazdzierniku 2002, celuje w VoIP, wideokonferencje i wszelkie scenariusze, w ktorych mowa musi byc efektywnie przesylana przez siec. Pliki SPX opakowujoa audio zakodowane w Speex wewnatrz kontenera Ogg, laczac optymalizacje mowy kodeka z mozliwosciami strumieniowania Ogg. Obslugiwane sa trzy czestotliwosci probkowania — waskie pasmo przy 8 kHz, szerokie pasmo przy 16 kHz i ultra-szerokie pasmo przy 32 kHz — wraz z kodowaniem o zmiennej szybkosci transmisji, ktore adaptuje sie w czasie rzeczywistym do zlozonosci mowy. Wyrozniajaca zaleta jest wolna od patentow, licencjonowana na BSD natura, pozwalajaca deweloperom swobodnie osadzac kodek zarowno w komercyjnych, jak i otwartorodlowych produktach. Speex laczy tez w sobie kasowanie echa akustycznego, tlumienie szumu i automatyczna regulacje wzmocnienia — funkcje, ktore rywalizujace kodeki zwykle deleguja do zewnetrznych bibliotek. Chociaz tworcy oficjalnie rekomenduja Opus jako nastepce od 2012 roku, Speex pozostaje wdrozony w starszych systemach VoIP, archiwalnych nagraniach i urzadzeniach wbudowanych, gdzie jego lekki dekoder nadal jest ceniony.
Pierwsze wydanie: 15 października 2002
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
Pierwsze wydanie: 1993