Konwerter plików SPX do HTK
Konwertuj swoje pliki w formacie spx do formatu htk przez Internet i bezpłatnie
spx
htk
Jak przekonwertować plik w formacie SPX do formatu HTK
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.
O formatach
Speex to otwartorodlowy kodek audio celowo zaprojektowany do kompresji mowy, opracowany przez Jean-Marc Valina pod auspicjami Xiph.Org Foundation. Po raz pierwszy wydany w pazdzierniku 2002, celuje w VoIP, wideokonferencje i wszelkie scenariusze, w ktorych mowa musi byc efektywnie przesylana przez siec. Pliki SPX opakowujoa audio zakodowane w Speex wewnatrz kontenera Ogg, laczac optymalizacje mowy kodeka z mozliwosciami strumieniowania Ogg. Obslugiwane sa trzy czestotliwosci probkowania — waskie pasmo przy 8 kHz, szerokie pasmo przy 16 kHz i ultra-szerokie pasmo przy 32 kHz — wraz z kodowaniem o zmiennej szybkosci transmisji, ktore adaptuje sie w czasie rzeczywistym do zlozonosci mowy. Wyrozniajaca zaleta jest wolna od patentow, licencjonowana na BSD natura, pozwalajaca deweloperom swobodnie osadzac kodek zarowno w komercyjnych, jak i otwartorodlowych produktach. Speex laczy tez w sobie kasowanie echa akustycznego, tlumienie szumu i automatyczna regulacje wzmocnienia — funkcje, ktore rywalizujace kodeki zwykle deleguja do zewnetrznych bibliotek. Chociaz tworcy oficjalnie rekomenduja Opus jako nastepce od 2012 roku, Speex pozostaje wdrozony w starszych systemach VoIP, archiwalnych nagraniach i urzadzeniach wbudowanych, gdzie jego lekki dekoder nadal jest ceniony.
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.