Konwerter plików SOU do HTK
Konwertuj swoje pliki w formacie sou do formatu htk przez Internet i bezpłatnie
sou
htk
Jak przekonwertować plik w formacie SOU do formatu HTK
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.
O formatach
SOU to oznaczenie surowego formatu audio, funkcjonujace jako alias dla 8-bitowych danych PCM bez znaku (u8) w systemie przetwarzania audio SoX. Pliki z rozszerzeniem .sou zawieraja beznaglowkowe, nieskompresowane probki audio przechowywane jako 8-bitowe liczby calkowite bez znaku — kazdy bajt reprezentuje pojedyncza wartosc amplitudy od 0 do 255, z 128 jako punktem ciszy. Poniewaz nie ma naglowka, parametry odtwarzania, takie jak czestotliwosc probkowania i liczba kanalow, musza byc okreslone zewnetrznie. Domyslne zalozenie to zwykle mono przy 8000 Hz, choc dane moga reprezentowac dowolna czestotliwosc obslugiwana przez sprzet nagrywajacy. Kodowanie u8, ktorego SOU jest aliasem, jest jedna z najprostszych mozliwych reprezentacji cyfrowego audio, poprzedzajaca ustrukturyzowane kontenery, takie jak WAV i AIFF. Surowe PCM bez znaku bylo powszechnie produkowane przez wczesne karty dzwiekowe i digitizery pod koniec lat 80. i na poczatku lat 90., gdy ograniczenia pamieciowe i limitowana moc obliczeniowa czynialy formaty bez naglowka praktycznym wyborem. Jedna z zalet jest absolutna prostota: pliki SOU moga byc odczytane przez dowolny program zdolny do podstawowego I/O plikow, bez parsowania struktur kontenerowych czy dekodowania metadanych — przydatne w systemach wbudowanych, diagnostyce sprzetowej i kontekstach edukacyjnych. Minimalny narzut formatu oznacza tez, ze konwersja do dowolnego nowoczesnego kontenera jest bezstratna i natychmiastowa, poniewaz surowe probki PCM moga byc opakowane w naglowek WAV lub AIFF bez jakiegokolwiek transkodowania.
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.