Konwerter plików MAUD do HTK

Konwertuj swoje pliki w formacie maud do formatu htk przez Internet i bezpłatnie

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Jak przekonwertować plik w formacie MAUD do formatu HTK

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.

O formatach

MAUD to format plikow audio opracowany przez MacroSystem dla platformy Commodore Amiga, wprowadzony na poczatku lat 90. jako czesc narzedzi do produkcji cyfrowego wideo i audio. Zbudowany na architekturze blokowej Amiga IFF (Interchange File Format), pliki MAUD organizuja dane w wyraznie oddzielone bloki — MHDR dla naglowka, MDAT dla danych probek i opcjonalne bloki adnotacji na metadane. Format obsluguje konfiguracje mono i stereo z glebiami bitowymi 8 lub 16 bitow i czestotliwosciami probkowania do 48 kHz, co stanowilo profesjonalne specyfikacje na sprzecie Amigi. Dostepne sa zarowno podpisane liniowe PCM, jak i kodowania A-law/mu-law, oferujace wybor miedzy wiernoscia a rozmiarem pliku. MAUD byl uzywany glownie w spolecznosci produkcji wideo na Amidze, gdzie karty MacroSystem Retina i VLab Motion wymagaly zsynchronizowanego audio, ktorego standardowy format 8SVX nie mogl zapewnic. Obsluga konwersji istnieje dzis dzieki SoX i libsndfile, co gwarantuje odzyskiwalnosc historycznych produkcji na Amidze. Trzy wyrozniajace sie zalety to: przejrzysta struktura oparta na IFF, ktora moze nawigowac dowolny parser obslugujacy bloki, 16-bitowe stereo wyprzedzajace typowe mozliwosci audio Amigi oraz lekki narzut pozostawiajacy maksimum mocy procesora na rendering wideo.
Pierwsze wydanie: 1992
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
Pierwsze wydanie: 1993