Konwerter plików CVU do NIST
Konwertuj swoje pliki w formacie cvu do formatu nist przez Internet i bezpłatnie
cvu
nist
Jak przekonwertować plik w formacie CVU do formatu NIST
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.
O formatach
CVU to wariant formatu telefonicznego CVS bez znaku, rozniacy sie sposobem reprezentacji wartosci zakodowanych delta w strumieniu binarnym. Podczas gdy CVS przechowuje wartosci delta nachylenia jako wielkosci ze znakiem, CVU traktuje je jako bez znaku, przesuwajac numeryczna interpretacje kazdej probki. Oba formaty dzielap te sama podstawowa technike modulacji CVSD — 1-bitowe adaptacyjne kodowanie delta, w ktorym wielkosc kroku zmienia sie zgodnie z ostatnimi wzorcami bitow wyjsciowych — dzialajac przy porownywalnch szybkosciach, zwykle 16 kbps dla waskiego pasma glosu przy 8 kHz. Roznica miedzy wersja ze znakiem a bez znaku ma znaczenie na etapie dekodowania, gdzie prawidlowa interpretacja decyduje o poprawnej rekonstrukcji przebiegu falowego. Pliki CVU pojawiaja sie w kontekstach telefonii i komunikacji wbudowanej, gdzie sprzet przyjoal konwencje bez znaku. Praktyczna zaleta jest bezposrednia wspolpraca z systemami natywnie uzywajacymi arytmetyki bez znaku, co eliminuje rozszerzanie znaku w dekoderach. Podobnie jak jego odpowiednik ze znakiem, CVU osiaga ekstremalnaefektywnosc pasma, kompresujac glos w kompaktowe strumienie bitow dla ograniczonych laczy. SoX obsluguje CVU, zapewniajac niezawodna sciezke konwersji tych niszowych nagran telefonicznych do wspolczesnych formatow na potrzeby analizy lub archiwizacji.
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.