Konwerter plików AMR do NIST
Konwertuj swoje pliki w formacie amr do formatu nist przez Internet i bezpłatnie
amr
nist
Jak przekonwertować plik w formacie AMR do formatu NIST
Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.
Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).
Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.
O formatach
AMR (Adaptive Multi-Rate) to skompresowany format audio zoptymalizowany pod katem mowy, standaryzowany przez Europejski Instytut Norm Telekomunikacyjnych i przyjety jako obowiazkowy kodek w sieciach GSM i 3G. Kodek dynamicznie przelacza sie miedzy osmioma szybkosciami transmisji — od 4,75 do 12,2 kbps — w zaleznosci od warunkow sieciowych i poziomu szumu tla. Gdy jakosc lacza spada, koder przechodzi na nizsza przepustowosc, wymieniaiac nieznaczna czytelnosc na niezawodnosc transmisji. Ten mechanizm adaptacyjny zdefiniowany jest w specyfikacjach 3GPP i reprezentuje jeden z najszerzej wdrozonych kodekow glosowych na swiecie, uzywany w miliardach polaczen telefonii komorkowej. Glowna zaleta jest efektywnosc kompresji: jedna minuta dzwieku AMR przy 12,2 kbps zajmuje ok. 90 KB, co jest praktyczne dla notatek glosowych, poczty glosowej i MMS w sieciach o ograniczonej przepustowosci. Kolejnym atutem jest wbudowana detekcja aktywnosci glosowej i generowanie szumu komfortu, co redukuje transmisje w czasie ciszy. Choc AMR nie nadaje sie do muzyki ze wzgledu na waskie pasmo (300-3400 Hz), doskonale sprawdza sie w dostarczaniu zrozumialej mowy w trudnych warunkach sieciowych.
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.