Konwerter plików NIST do CVSD
Konwertuj swoje pliki w formacie nist do formatu cvsd przez Internet i bezpłatnie
nist
cvsd
Jak przekonwertować plik w formacie NIST do formatu CVSD
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format cvsd lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu cvsd; od razu po konwersji możesz go pobrać.
O formatach
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.
CVSD (Continuously Variable Slope Delta modulation) to metoda digitalizacji glosu znormalizowana dla zastosowan wojskowych i telekomunikacyjnych przez NATO i CCITT w latach 70. XX wieku. Koduje roznice miedzy kolejnymi probkami jako pojedynczy bit — 1, jesli biezaca probka przekracza predykcje, 0 w przeciwnym razie — podczas gdy filtr kompresji sylabicznej dostosowuje wielkosc kroku, monitorujac serie identycznych bitow. Dzialajac przy 16 do 64 kbps, CVSD rownowazy zrozumialosc mowy z przepustowoscia, co czyni go preferowanym kodowaniem dla bezpiecznych laczy wojskowych i taktycznych systemow radiowych. Strumien bitow moze byc dekodowany za pomoca prostego sprzetu, pierwotnie wbudowanego w dedykowane uklady scalone. Jedna z zalet jest prostota implementacji — kodery i dekodery wymagaja minimalnych zasobow, umozliwiajac przetwarzanie w czasie rzeczywistym na niskoenergetycznym sprzecie wbudowanym. Odpornosc w warunkach zaszumionych to kolejny atut, poniewaz bledy pojedynczych bitow wplywaja jedynie na lokalne probki, a nie uszkadzaja calych ramek. SoX zapewnia programowe kodowanie i dekodowanie, umozliwiajac wspolczesnym systemom prace z archiwalnymi nagraniami CVSD z archiwow wojskowych i infrastruktury telekomunikacyjnej.