Konwerter AV1 na NIST

Wyodrębnij audio NIST Sphere z wideo AV1 online

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standard badawczy

NIST Sphere to rządowy standard wymiany danych mowy — konwersja z AV1 tworzy audio gotowe do badań.

Ustawienia korpusu

Skonfiguruj częstotliwość próbkowania i kodowanie, aby dopasować dokładne wymagania ewaluacji lub korpusu treningowego mowy.

Bezpieczna konwersja

Pliki AV1 usuwane zaraz po przetworzeniu, a pliki NIST kasowane w ciągu 24 godzin.

Jak przekonwertować plik w formacie AV1 do formatu NIST

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.

O formatach

AV1 (AOMedia Video 1) to otwarty, wolny od tantiem format kodowania wideo opracowany przez Alliance for Open Media — konsorcjum, ktorego czlonkami zalozycielskimi sa m.in. Google, Mozilla, Microsoft, Amazon, Netflix i Intel. Specyfikacja zostala sfinalizowana w czerwcu 2018 roku z celem dostarczenia kodeka wideo nastepnej generacji, przewyzszajacego efektywnosc kompresji H.264 i HEVC, przy jednoczesnym braku oplat licencyjnych. AV1 osiaga mniej wiecej 30-50% lepsza kompresje niz HEVC przy rownowaznej jakosci wizualnej, co czyni go szczegolnie atrakcyjnym dla platform streamingowych dazacych do obnizenia kosztow przepustowosci bez poswiecania doswiadczenia widza. Kodek obsluguje szeroki zakres funkcji, w tym synteze ziarna filmowego, elastyczne kafelkowanie do rownoleglego przetwarzania, adaptacyjne przelaczanie rozdzielczosci oraz bogaty zestaw trybów predykcji intra i inter. Sprzetowa obsluga dekodowania gwaltownie rosnie w procesorach mobilnych, GPU i telewizorach smart, rozwiazujac poczatkowe obawy dotyczace wymagan obliczeniowych podczas kodowania. AV1 jest szeroko adoptowany przez glowne serwisy streamingowe do dostarczania tresci 4K i HDR, a takze sluzy jako komponent wideo kontenera WebM do odtwarzania w przegladarkach. Status wolny od tantiem czyni AV1 szczegolnie waznym dla otwartych standardow internetowych i dostepnej dystrybucji mediow.
Pierwsze wydanie: 25 czerwca 2018
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.
Pierwsze wydanie: 1990

Często Zadawane Pytania

Dlaczego warto konwertować AV1 na NIST?

NIST Sphere to standardowy format wymiany danych mowy w badaniach — używany przez rządowe i akademickie programy ewaluacji mowy.

Czym otworzyć pliki NIST?

Narzędzia mowy NIST, SoX, Kaldi i HTK obsługują audio NIST Sphere do celów badawczych i ewaluacyjnych.

Czym różni się NIST od SPH?

NIST i SPH odnoszą się do tego samego formatu NIST Sphere — różne rozszerzenia plików dla identycznych specyfikacji kontenera audio.

Jakie ustawienia są najlepsze?

Badania mowy zwykle wymagają 8 kHz lub 16 kHz, 16-bit mono — dopasuj do specyfikacji swojego korpusu.

Czy moje dane są prywatne?

Pliki AV1 usuwane natychmiast. Pliki NIST kasowane w ciągu 24 godzin.