Konwerter plików GSM do NIST
Konwertuj swoje pliki w formacie gsm do formatu nist przez Internet i bezpłatnie
gsm
nist
Jak przekonwertować plik w formacie GSM do formatu NIST
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.
O formatach
GSM 06.10 (Full Rate) to podstawowy kodek mowy standardu Global System for Mobile Communications, ratyfikowany przez ETSI w 1991 roku i wdrozony w setkach sieci komorkowych na calym swiecie. Dzialajac przy stalym 13 kbit/s, algorytm stosuje wzbudzenie impulsami regularnymi z predykcja dlugoterminowa (RPE-LTP) do kompresji 20 ms ramek mowy monofonicznej 8 kHz do zaledwie 33 bajtow kazdej. Podejscie to modeluje trakt glosowy jako liniowy filtr predykcyjny, koduje sygnal wzbudzenia i wykorzystuje periodycznosc tonu podstawowego do dalszej redukcji — dostrojone, by dostarczac zrozumiala mowe w warunkach ograniczonej przepustowosci wczesnych cyfrowych kanalow mobilnych. Kodek zasila nie tylko telefonie GSM, ale rowniez wiele aplikacji VoIP, systemow poczty glosowej i platform IVR, ktore korzystaja z niskiego bitrate. Trzy konkretne zalety wyrózniaja GSM. Po pierwsze, nadzwyczajna kompresja: minuta mowy miesci sie w ok. 100 KB, umozliwiajac efektywne przechowywanie i transmisje. Po drugie, uniwersalne narzedzia — biblioteki takie jak libgsm i SoX obsluguja kodowanie i dekodowanie na kazdej wiekszej platformie. Po trzecie, krajobraz patentowy wolny od tantiem zachecil do adopcji w projektach telefonii open-source, takich jak Asterisk i FreeSWITCH.
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.