Konwerter plików DVMS do NIST
Konwertuj swoje pliki w formacie dvms do formatu nist przez Internet i bezpłatnie
dvms
nist
Jak przekonwertować plik w formacie DVMS do formatu NIST
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.
O formatach
DVMS (Dutch Voice Messaging System) to kodowanie audio klasy telefonicznej, powstale z holenderskiej inicjatywy cyfrowej poczty glosowej. Wdrozone przez KPN (dawniej PTT Telecom) w polowie lat 80. XX wieku, format przechowuje monofoniczne dane glosowe przy waskiej czestotliwosci probkowania 8 kHz, przedkladajac kompaktowy rozmiar wiadomosci nad szerokosc pasma. Audio jest kompresowane z uzyciem wlasciciowej odmiany kompresji logarytmicznej, podobnej do europejskiego kodowania A-law, sciskajac nagrania do ok. 8 kbit/s przy zachowaniu zrozumialej mowy. Kazdy plik zawiera maly naglowek identyfikujacy czestotliwosc probkowania, typ kompresji i metadane wiadomosci, co upraszczalo automatyczne trasowanie w systemach PBX i poczty glosowej wczesnej ery. Chociaz DVMS nigdy nie zyskal popularnosci poza holenderskimi kregami telekomunikacyjnymi, wplynal na sposob, w jaki europejscy operatorzy projektowali pozniejsze protokoly poczty glosowej. Narzedzia takie jak SoX i kilka starszych bibliotek telefonicznych nadal odczytuja i zapisuja pliki DVMS, umozliwiajac archiwalne odtwarzanie wiadomosci sprzed dziesiecioleci. Wsrod praktycznych zalet: wyjatkowo male rozmiary plikow (jednominutowa wiadomosc zajmuje ok. 60 KB), niezawodna czytelnosc mowy pomimo agresywnej kompresji oraz prosty uklad kontenera, latwy do parsowania programistycznego.
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.