Konwerter plików HTK do IRCAM
Konwertuj swoje pliki w formacie htk do formatu ircam przez Internet i bezpłatnie
htk
ircam
Jak przekonwertować plik w formacie HTK do formatu IRCAM
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format ircam lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu ircam; od razu po konwersji możesz go pobrać.
O formatach
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
Pliki dzwiekowe IRCAM wywodza sie z Institut de Recherche et Coordination Acoustique/Musique — jednego z najwazniejszych na swiecie laboratoriow muzyki komputerowej, zalozonego przez kompozytora Pierre'a Bouleza w Paryzu. Format zostal stworzony na poczatku lat 80. na potrzeby badawcze IRCAM i od tego czasu zostal przyjety przez spolecznosci akademickie i artystyczne dzialajace na styku nauki i dzwieku. Plik IRCAM zaczyna sie od 1024-bajtowego naglowka zawierajacego liczbe magiczna, czestotliwosc probkowania, liczbe kanalow i pole typu kodowania, obslugujace liniowe PCM (16/32-bitowe calkowite i 32-bitowe zmiennoprzecinkowe), mu-law i warianty A-law. Blok naglowka miesci tez dowolny tekst adnotacyjny, pozwalajacy badaczom osadzac metadane eksperymentu bezposrednio w pliku audio. Poniewaz domyslna zawartosc jest nieskompresowana, nagrania zachowuja pelna wiernosc podczas kolejnych cykli analizy i resyntezy — niezbedna cecha w eksperymentach psychoakustycznych. Oprogramowanie takie jak Csound, libsndfile i SoX odczytuje i zapisuje ten format natywnie. Kluczowe zalety to dobrze zdefiniowany naglowek eliminujacy niejednoznacznosc parsowania, obsluga probek zmiennoprzecinkowych niezbedna w naukowym przetwarzaniu sygnalow oraz glebokie korzenie w spolecznosci muzyki komputerowej zapewniajace ciagla obsluge narzedzi.