Konwerter plików CVSD do HTK
Konwertuj swoje pliki w formacie cvsd do formatu htk przez Internet i bezpłatnie
cvsd
htk
Jak przekonwertować plik w formacie CVSD do formatu HTK
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.
O formatach
CVSD (Continuously Variable Slope Delta modulation) to metoda digitalizacji glosu znormalizowana dla zastosowan wojskowych i telekomunikacyjnych przez NATO i CCITT w latach 70. XX wieku. Koduje roznice miedzy kolejnymi probkami jako pojedynczy bit — 1, jesli biezaca probka przekracza predykcje, 0 w przeciwnym razie — podczas gdy filtr kompresji sylabicznej dostosowuje wielkosc kroku, monitorujac serie identycznych bitow. Dzialajac przy 16 do 64 kbps, CVSD rownowazy zrozumialosc mowy z przepustowoscia, co czyni go preferowanym kodowaniem dla bezpiecznych laczy wojskowych i taktycznych systemow radiowych. Strumien bitow moze byc dekodowany za pomoca prostego sprzetu, pierwotnie wbudowanego w dedykowane uklady scalone. Jedna z zalet jest prostota implementacji — kodery i dekodery wymagaja minimalnych zasobow, umozliwiajac przetwarzanie w czasie rzeczywistym na niskoenergetycznym sprzecie wbudowanym. Odpornosc w warunkach zaszumionych to kolejny atut, poniewaz bledy pojedynczych bitow wplywaja jedynie na lokalne probki, a nie uszkadzaja calych ramek. SoX zapewnia programowe kodowanie i dekodowanie, umozliwiajac wspolczesnym systemom prace z archiwalnymi nagraniami CVSD z archiwow wojskowych i infrastruktury telekomunikacyjnej.
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.