Konwerter plików HTK do MAUD
Konwertuj swoje pliki w formacie htk do formatu maud przez Internet i bezpłatnie
htk
maud
Jak przekonwertować plik w formacie HTK do formatu MAUD
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format maud lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu maud; od razu po konwersji możesz go pobrać.
O formatach
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
MAUD to format plikow audio opracowany przez MacroSystem dla platformy Commodore Amiga, wprowadzony na poczatku lat 90. jako czesc narzedzi do produkcji cyfrowego wideo i audio. Zbudowany na architekturze blokowej Amiga IFF (Interchange File Format), pliki MAUD organizuja dane w wyraznie oddzielone bloki — MHDR dla naglowka, MDAT dla danych probek i opcjonalne bloki adnotacji na metadane. Format obsluguje konfiguracje mono i stereo z glebiami bitowymi 8 lub 16 bitow i czestotliwosciami probkowania do 48 kHz, co stanowilo profesjonalne specyfikacje na sprzecie Amigi. Dostepne sa zarowno podpisane liniowe PCM, jak i kodowania A-law/mu-law, oferujace wybor miedzy wiernoscia a rozmiarem pliku. MAUD byl uzywany glownie w spolecznosci produkcji wideo na Amidze, gdzie karty MacroSystem Retina i VLab Motion wymagaly zsynchronizowanego audio, ktorego standardowy format 8SVX nie mogl zapewnic. Obsluga konwersji istnieje dzis dzieki SoX i libsndfile, co gwarantuje odzyskiwalnosc historycznych produkcji na Amidze. Trzy wyrozniajace sie zalety to: przejrzysta struktura oparta na IFF, ktora moze nawigowac dowolny parser obslugujacy bloki, 16-bitowe stereo wyprzedzajace typowe mozliwosci audio Amigi oraz lekki narzut pozostawiajacy maksimum mocy procesora na rendering wideo.