Konwerter MPEG na NIST

Stwórz audio NIST SPHERE z plików wideo MPEG online

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Zgodność ze standardami

Wyjście NIST SPHERE spełnia specyfikacje National Institute of Standards and Technology — kompatybilne ze wszystkimi głównymi frameworkami badawczymi ASR.

MPEG na NIST bezpośrednio

Przejdź z wideo MPEG na audio mowy NIST w jednym kroku. Bez ręcznej ekstrakcji audio czy pośredniej konwersji formatów.

W przeglądarce

Nie potrzeba lokalnie zestawu SPHERE ani dekoderów MPEG. Konwertuj MPEG na NIST przez przeglądarkę internetową na dowolnym urządzeniu lub platformie.

Jak przekonwertować plik w formacie MPEG do formatu NIST

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.

O formatach

MPEG (MPEG-1) to fundamentalny standard kompresji wideo i audio opublikowany w sierpniu 1993 roku przez Moving Picture Experts Group jako ISO/IEC 11172. Byl to pierwszy miedzynarodowy standard stratnej kompresji ruchomych obrazow i towarzyszacego audio, ustanawiajacy zasady i techniki, ktore wplynely na praktycznie wszystkie kolejne kodeki wideo. Wideo MPEG-1 osiaga kompresje poprzez kombinacje predykcji kompensowanej ruchem, kodowania dyskretna transformata kosinusowa i kodowania entropijnego o zmiennej dlugosci, zorganizowanego wokol trzech typow klatek: I-klatki (kodowane wewnetrznie), P-klatki (predykcyjne) i B-klatki (predykcyjne dwukierunkowo). Standard celuje w szybkosci transmisji ok. 1,5 Mbps dla laczonego audio i wideo, tworzac jakosc porownywalna z tasma VHS przy rozdzielczosci SIF (352x240 dla NTSC). Ten poziom kompresji zostal specjalnie dobrany, by odpowiadac przepustowosci danych napedow CD-ROM o predkosci 1x, umozliwiajac format Video CD, ktory przyniosl cyfrowe wideo konsumentom na poczatku lat 90. Komponent audio, szczegolnie Layer III (MP3), stal sie najbardziej wplywowym formatem audio w historii. Struktura klatek I/P/B, podejscie do estymacji ruchu i kodowanie transformata blokowa ustanowily architektoniczny szablon stosowany przez kazdy wiekszy kodek wideo od tamtej pory — od MPEG-2 przez H.264 i dalej. Choc dawno przewyzszony pod wzgledem efektywnosci kompresji, MPEG-1 pozostaje obslugiwany przez praktycznie kazde oprogramowanie multimedialne.
Pierwsze wydanie: Sierpień 1993
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.
Pierwsze wydanie: 1990

Często Zadawane Pytania

Dlaczego warto konwertować MPEG na NIST?

NIST SPHERE to wzorcowy format do dystrybucji danych mowy. Dialog z wideo MPEG staje się standaryzowanym audio do badań nad rozpoznawaniem.

Czym NIST różni się od SPH?

To ten sam format — SPHERE od National Institute of Standards and Technology. NIST i SPH to zamienne rozszerzenia.

Czy NIST obsługuje jakość MPEG?

NIST przechowuje PCM bez kompresji. Audio wyodrębnione z MPEG jest zachowane w pełnej jakości, niezależnie od oryginalnego kodowania MPEG.

Jakie narzędzia ASR akceptują NIST?

Kaldi, HTK, frameworki ewaluacyjne NIST i większość akademickich laboratoriów mowy pracuje z audio NIST SPHERE jako standardowym formatem wejściowym.

Czy przetwarzanie wsadowe jest dostępne?

Tak — prześlij wiele filmów MPEG i konwertuj je wszystkie na NIST naraz. Praktyczne do budowania korpusów z archiwów wideo.