Konwerter plików GSM do HTK
Konwertuj swoje pliki w formacie gsm do formatu htk przez Internet i bezpłatnie
gsm
htk
Jak przekonwertować plik w formacie GSM do formatu HTK
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.
O formatach
GSM 06.10 (Full Rate) to podstawowy kodek mowy standardu Global System for Mobile Communications, ratyfikowany przez ETSI w 1991 roku i wdrozony w setkach sieci komorkowych na calym swiecie. Dzialajac przy stalym 13 kbit/s, algorytm stosuje wzbudzenie impulsami regularnymi z predykcja dlugoterminowa (RPE-LTP) do kompresji 20 ms ramek mowy monofonicznej 8 kHz do zaledwie 33 bajtow kazdej. Podejscie to modeluje trakt glosowy jako liniowy filtr predykcyjny, koduje sygnal wzbudzenia i wykorzystuje periodycznosc tonu podstawowego do dalszej redukcji — dostrojone, by dostarczac zrozumiala mowe w warunkach ograniczonej przepustowosci wczesnych cyfrowych kanalow mobilnych. Kodek zasila nie tylko telefonie GSM, ale rowniez wiele aplikacji VoIP, systemow poczty glosowej i platform IVR, ktore korzystaja z niskiego bitrate. Trzy konkretne zalety wyrózniaja GSM. Po pierwsze, nadzwyczajna kompresja: minuta mowy miesci sie w ok. 100 KB, umozliwiajac efektywne przechowywanie i transmisje. Po drugie, uniwersalne narzedzia — biblioteki takie jak libgsm i SoX obsluguja kodowanie i dekodowanie na kazdej wiekszej platformie. Po trzecie, krajobraz patentowy wolny od tantiem zachecil do adopcji w projektach telefonii open-source, takich jak Asterisk i FreeSWITCH.
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.