Konwerter plików HTK do FSSD
Konwertuj swoje pliki w formacie htk do formatu fssd przez Internet i bezpłatnie
htk
fssd
Jak przekonwertować plik w formacie HTK do formatu FSSD
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format fssd lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu fssd; od razu po konwersji możesz go pobrać.
O formatach
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
FSSD to surowy format audio wywodzacy sie z klasycznego ekosystemu Macintosh, gdzie urzadzenie MacRecorder firmy Farallon Computing (1988) przechowywalo zdigitalizowany dzwiek jako 8-bitowe PCM bez znaku w wpisach resource fork oznaczonych kodem typu 'FSSD'. We wspolczesnych narzedziach do przetwarzania dzwieku, takich jak SoX, FSSD jest traktowany jako alias dla formatu u8 (8-bitowy bez znaku) — plikow bez naglowka zawierajacych plaski strumien jednobajtowych probek amplitudy, gdzie kazda wartosc od 0 do 255 reprezentuje poziom dzwieku, a 128 stanowi punkt srodkowy. Poniewaz nie ma naglowka, parametry odtwarzania, takie jak czestotliwosc probkowania i liczba kanalow, musza byc podane zewnetrznie. Oryginalny MacRecorder zwykle rejestrowal przy czestotliwosciach do 22 kHz w trybie mono, choc dowolna czestotliwosc probkowania jest poprawna podczas interpretacji surowych danych. FSSD i jego skompresowany odpowiednik HCOM (dodajacy kompresje Huffmana do tych samych danych bazowych) byly standardowymi formatami audio wczesnych multimediow Mac: stosy HyperCard, edukacyjne CD-ROM-y i dzwieki systemowe z konca lat 80. i poczatku lat 90. opieraly sie w duzej mierze na tym kodowaniu. Zaleta surowego formatu FSSD jest trywialna latwosc parsowania — bez narzutu kontenera dane audio zaczynaja sie od bajtu zerowego i moga byc odczytane przez dowolne narzedzie zdolne do przetwarzania 8-bitowego PCM bez znaku. Historyczne znaczenie formatu sprawia tez, ze jest on praktycznie istotny dla archiwistow cyfrowych: konwersja nagran FSSD do nowoczesnych kontenerow, takich jak WAV, zachowuje oryginalna zawartosc audio bezstratnie, poniewaz surowe probki wymagaja jedynie dodania naglowka, a nie transkodowania.