Konwerter plików SLN do HTK

Konwertuj swoje pliki w formacie sln do formatu htk przez Internet i bezpłatnie

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Jak przekonwertować plik w formacie SLN do formatu HTK

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.

O formatach

SLN (Signed Linear) to surowy format audio bez naglowka, przechowujacy 16-bitowe probki liniowe PCM ze znakiem przy 8000 Hz mono, najscislej powiazany z Asterisk — otwartorodlowym systemem PBX opracowanym przez Digium (obecnie Sangoma Technologies). W ramach Asteriska SLN sluzy jako natywna wewnetrzna reprezentacja audio: kazda operacja transkodowania kodekow przechodzi przez signed linear jako etap posredni. To czyni SLN kregoslupem architektury translacji kodekow Asteriska. Format nie zawiera nic oprocz surowych probek — zadnych naglowkow, metadanych ani ramkowania — wiec parametry musza byc znane z gory. Choc ten brak samoopisu moze wydawac sie ograniczajacy, jest w rzeczywistosci zaleta w telefonii, gdzie format probek jest ustalony konwencja, a kazdy bajt narzutu ma znaczenie przy tysioacach rownoczesnych kanalow. Czestotliwosc 8000 Hz jest zgodna ze standardem G.711 dla tradycyjnej telefonii, obejmujac pelne pasmo glosowe 300-3400 Hz. Asterisk obsluguje rowniez rozszerzone warianty (sln16, sln32, sln48) dla audio szerokopasmowego. Pliki SLN nie wymagaja dekodowania — jedynie bezposredniego mapowania pamieci — co czyni je idealnymi do miksowania w czasie rzeczywistym, konferencji i odtwarzania promptow w srodowiskach VoIP o wysokiej gestoosci.
Pierwsze wydanie: 1999
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
Pierwsze wydanie: 1993