Konwerter plików DSS do HTK
Konwertuj swoje pliki w formacie dss do formatu htk przez Internet i bezpłatnie
dss
htk
Jak przekonwertować plik w formacie DSS do formatu HTK
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.
O formatach
DSS (Digital Speech Standard) to wlasciciowy format nagrywania glosu opracowany przez Olympus, Philips i Grundig w 1994 roku za posrednictwem International Voice Association. Zaprojektowany z mysla o przepływach pracy dyktowania, DSS stosuje kompresje zoptymalizowana pod katem mowy przy bardzo niskich szybkosciach transmisji — oryginalny standard koduje przy ok. 13,7 kbps, a DSS Pro osiaga ok. 28 kbps z poprawiona czytelnoscia. Kodek koncentruje swój budzet na zakresach czestotliwosci charakterystycznych dla ludzkiej mowy, zamiast na pelnym spektrum audio, tworzac wyjatkowo kompaktowe pliki. Profesjonalne dyktafony Olympusa i Philipsa uzywaja DSS natywnie, integrujac sie z oprogramowaniem do transkrypcji obslugujacym flagi priorytetow, zakladki i identyfikacje autora w metadanych plikow. Jedna z zalet jest efektywnosc rozmiaru pliku: godzina dyktowania zajmuje zaledwie 6-12 MB, co jest praktyczne w srodowiskach o duzym wolumenie, takich jak szpitale, kancelarie prawne i sady. Wbudowane metadane umozliwiaja bezproblemowe kierowanie przez kolejki transkrypcji z automatycznym sortowaniem priorytetow. Chociaz DSS jest formatem zamknietym z odtwarzaniem ograniczonym do kompatybilnego oprogramowania, jego dominacja w profesjonalnym dyktowaniu zapewnia ciagla obsluge przez glowne platformy transkrypcyjne.
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.