Konwerter plików HTK do WAV
Konwertuj swoje pliki w formacie htk do formatu wav przez Internet i bezpłatnie
htk
wav
Ustawienia
PCM_S16LE (Nieskompresowany)
Kodek do kodowania ścieżki audio. Kodek „bez ponownego kodowania” kopiuje strumień audio z pliku wejściowego do wyjściowego bez ponownego kodowania, jeśli to możliwe.
Automatycznie (Bez zmian)
Ustaw liczbę kanałów audio. To ustawienie jest najbardziej przydatne podczas ograniczania liczby kanałów (np. z 5.1 do stereo).
Automatycznie (Bez zmian)
Ustaw częstotliwość próbkowania audio. Muzyka z pełnym spektrum (20 Hz – 20 kHz) wymaga wartości nie mniejszych niż 44.1 kHz, aby osiągnąć transparentność. Więcej informacji można znaleźć w wiki.
htk
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
czytaj więcej
wav
WAV (Waveform Audio File Format) to nieskompresowany kontener audio wspolnie opracowany przez Microsoft i IBM, po raz pierwszy opublikowany w sierpniu 1991 roku wraz z Windowsem 3.1. Zbudowany na formacie Resource Interchange File Format (RIFF), WAV przechowuje dane audio — najczesciej jako liniowa modulacje impulsowo-kodowa (LPCM) — wraz z metadanymi opisujacymi czestotliwosc probkowania, glebie bitowa i liczbe kanalow. Ta prosta struktura uczynia WAV de facto standardem nieskompresowanego audio na Windowsie i uniwersalnie akceptowanym formatem wymiany w praktycznie kazdym systemie operacyjnym, edytorze audio i odtwarzaczu multimedialnym. Pliki WAV jakosci CD uzywaja 16-bitowych probek przy 44,1 kHz stereo, natomiast profesjonalne przeplywy pracy rutynowo stosuja 24-bitowe lub 32-bitowe probki zmiennoprzecinkowe przy czestotliwosciach do 192 kHz. Glowna zaleta jest bezstratna wiernosc: poniewaz standardowy WAV nie stosuje kompresji, przechowywane dane sa dokladna cyfrowa reprezentacja oryginalnego nagrania, co czyni go preferowanym wyborem do masteringu i archiwizacji. WAV obsluguje rowniez osadzone metadane przez bloki INFO i BWF, umozliwiajac znaczniki czasowe i notatki produkcyjne. Glownym kompromisem jest rozmiar pliku — minuta stereo jakosci CD zajmuje ok. 10 MB — a 32-bitowa struktura RIFF narzuca limit 4 GB, choc RF64 znosi to ograniczenie.
czytaj więcej
Jak przekonwertować plik w formacie HTK do formatu WAV
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format wav lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu wav; od razu po konwersji możesz go pobrać.
O formatach
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
WAV (Waveform Audio File Format) to nieskompresowany kontener audio wspolnie opracowany przez Microsoft i IBM, po raz pierwszy opublikowany w sierpniu 1991 roku wraz z Windowsem 3.1. Zbudowany na formacie Resource Interchange File Format (RIFF), WAV przechowuje dane audio — najczesciej jako liniowa modulacje impulsowo-kodowa (LPCM) — wraz z metadanymi opisujacymi czestotliwosc probkowania, glebie bitowa i liczbe kanalow. Ta prosta struktura uczynia WAV de facto standardem nieskompresowanego audio na Windowsie i uniwersalnie akceptowanym formatem wymiany w praktycznie kazdym systemie operacyjnym, edytorze audio i odtwarzaczu multimedialnym. Pliki WAV jakosci CD uzywaja 16-bitowych probek przy 44,1 kHz stereo, natomiast profesjonalne przeplywy pracy rutynowo stosuja 24-bitowe lub 32-bitowe probki zmiennoprzecinkowe przy czestotliwosciach do 192 kHz. Glowna zaleta jest bezstratna wiernosc: poniewaz standardowy WAV nie stosuje kompresji, przechowywane dane sa dokladna cyfrowa reprezentacja oryginalnego nagrania, co czyni go preferowanym wyborem do masteringu i archiwizacji. WAV obsluguje rowniez osadzone metadane przez bloki INFO i BWF, umozliwiajac znaczniki czasowe i notatki produkcyjne. Glownym kompromisem jest rozmiar pliku — minuta stereo jakosci CD zajmuje ok. 10 MB — a 32-bitowa struktura RIFF narzuca limit 4 GB, choc RF64 znosi to ograniczenie.