Konwerter plików DSS do HTK

Konwertuj swoje pliki w formacie dss do formatu htk przez Internet i bezpłatnie

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Jak przekonwertować plik w formacie DSS do formatu HTK

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.

O formatach

DSS (Digital Speech Standard) to wlasciciowy format nagrywania glosu opracowany przez Olympus, Philips i Grundig w 1994 roku za posrednictwem International Voice Association. Zaprojektowany z mysla o przepływach pracy dyktowania, DSS stosuje kompresje zoptymalizowana pod katem mowy przy bardzo niskich szybkosciach transmisji — oryginalny standard koduje przy ok. 13,7 kbps, a DSS Pro osiaga ok. 28 kbps z poprawiona czytelnoscia. Kodek koncentruje swój budzet na zakresach czestotliwosci charakterystycznych dla ludzkiej mowy, zamiast na pelnym spektrum audio, tworzac wyjatkowo kompaktowe pliki. Profesjonalne dyktafony Olympusa i Philipsa uzywaja DSS natywnie, integrujac sie z oprogramowaniem do transkrypcji obslugujacym flagi priorytetow, zakladki i identyfikacje autora w metadanych plikow. Jedna z zalet jest efektywnosc rozmiaru pliku: godzina dyktowania zajmuje zaledwie 6-12 MB, co jest praktyczne w srodowiskach o duzym wolumenie, takich jak szpitale, kancelarie prawne i sady. Wbudowane metadane umozliwiaja bezproblemowe kierowanie przez kolejki transkrypcji z automatycznym sortowaniem priorytetow. Chociaz DSS jest formatem zamknietym z odtwarzaniem ograniczonym do kompatybilnego oprogramowania, jego dominacja w profesjonalnym dyktowaniu zapewnia ciagla obsluge przez glowne platformy transkrypcyjne.
Pierwsze wydanie: 1994
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
Pierwsze wydanie: 1993