Konwerter plików HTK do AMB
Konwertuj swoje pliki w formacie htk do formatu amb przez Internet i bezpłatnie
htk
amb
Jak przekonwertować plik w formacie HTK do formatu AMB
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format amb lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu amb; od razu po konwersji możesz go pobrać.
O formatach
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
Pliki AMB zawieraja dzwiek zakodowany w formacie Ambisonic B-format — technice dzwieku przestrzennego pelnej sfery, opracowanej przez Michaela Gerzona w latach 70. XX wieku. W odroznieniu od systemow kanalowych, takich jak 5.1 czy 7.1, Ambisonics rejestruje pelne trojwymiarowe pole akustyczne za pomoca harmonicznych sferycznych — B-format pierwszego rzedu sklada sie z czterech kanalow: W (dookólny), X (przod-tyl), Y (lewo-prawo) i Z (gora-dol). Reprezentacja ta jest niezalezna od ukladu glosnikow, co oznacza, ze jedno nagranie moze byc dekodowane na dowolna konfiguracje glosnikow lub sluchawki binauralne bez koniecznosci remiksowania. Pliki AMB zwykle przechowuja nieskompresowane dane PCM i sa przetwarzane przez narzedzia takie jak SoX lub specjalistyczne wtyczki. Kluczowa zaleta jest elastycznosc przestrzenna — tworcy przygotowuja jeden plik master, ktory dostosowuje sie do odtwarzania stereo, surround lub immersyjnego. Format skaluje sie tez elegancko: Ambisonics wyzszych rzedow dodaje kanaly zwiekszajace precyzje przestrzenna w oparciu o te sama platforme matematyczna. Wraz z rozwojem rzeczywistosci wirtualnej, wideo 360 stopni i przestrzennego audio w grach, Ambisonics przezywa renesans — wykorzystuja go m.in. platformy takie jak YouTube do dostarczania tresci immersyjnych.