Konwerter plików IRCAM do HTK

Konwertuj swoje pliki w formacie ircam do formatu htk przez Internet i bezpłatnie

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Jak przekonwertować plik w formacie IRCAM do formatu HTK

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.

O formatach

Pliki dzwiekowe IRCAM wywodza sie z Institut de Recherche et Coordination Acoustique/Musique — jednego z najwazniejszych na swiecie laboratoriow muzyki komputerowej, zalozonego przez kompozytora Pierre'a Bouleza w Paryzu. Format zostal stworzony na poczatku lat 80. na potrzeby badawcze IRCAM i od tego czasu zostal przyjety przez spolecznosci akademickie i artystyczne dzialajace na styku nauki i dzwieku. Plik IRCAM zaczyna sie od 1024-bajtowego naglowka zawierajacego liczbe magiczna, czestotliwosc probkowania, liczbe kanalow i pole typu kodowania, obslugujace liniowe PCM (16/32-bitowe calkowite i 32-bitowe zmiennoprzecinkowe), mu-law i warianty A-law. Blok naglowka miesci tez dowolny tekst adnotacyjny, pozwalajacy badaczom osadzac metadane eksperymentu bezposrednio w pliku audio. Poniewaz domyslna zawartosc jest nieskompresowana, nagrania zachowuja pelna wiernosc podczas kolejnych cykli analizy i resyntezy — niezbedna cecha w eksperymentach psychoakustycznych. Oprogramowanie takie jak Csound, libsndfile i SoX odczytuje i zapisuje ten format natywnie. Kluczowe zalety to dobrze zdefiniowany naglowek eliminujacy niejednoznacznosc parsowania, obsluga probek zmiennoprzecinkowych niezbedna w naukowym przetwarzaniu sygnalow oraz glebokie korzenie w spolecznosci muzyki komputerowej zapewniajace ciagla obsluge narzedzi.
Twórca: IRCAM
Pierwsze wydanie: 1983
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
Pierwsze wydanie: 1993