Konwerter plików HTK do SLN
Konwertuj swoje pliki w formacie htk do formatu sln przez Internet i bezpłatnie
htk
sln
Jak przekonwertować plik w formacie HTK do formatu SLN
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format sln lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu sln; od razu po konwersji możesz go pobrać.
O formatach
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
SLN (Signed Linear) to surowy format audio bez naglowka, przechowujacy 16-bitowe probki liniowe PCM ze znakiem przy 8000 Hz mono, najscislej powiazany z Asterisk — otwartorodlowym systemem PBX opracowanym przez Digium (obecnie Sangoma Technologies). W ramach Asteriska SLN sluzy jako natywna wewnetrzna reprezentacja audio: kazda operacja transkodowania kodekow przechodzi przez signed linear jako etap posredni. To czyni SLN kregoslupem architektury translacji kodekow Asteriska. Format nie zawiera nic oprocz surowych probek — zadnych naglowkow, metadanych ani ramkowania — wiec parametry musza byc znane z gory. Choc ten brak samoopisu moze wydawac sie ograniczajacy, jest w rzeczywistosci zaleta w telefonii, gdzie format probek jest ustalony konwencja, a kazdy bajt narzutu ma znaczenie przy tysioacach rownoczesnych kanalow. Czestotliwosc 8000 Hz jest zgodna ze standardem G.711 dla tradycyjnej telefonii, obejmujac pelne pasmo glosowe 300-3400 Hz. Asterisk obsluguje rowniez rozszerzone warianty (sln16, sln32, sln48) dla audio szerokopasmowego. Pliki SLN nie wymagaja dekodowania — jedynie bezposredniego mapowania pamieci — co czyni je idealnymi do miksowania w czasie rzeczywistym, konferencji i odtwarzania promptow w srodowiskach VoIP o wysokiej gestoosci.