Konwerter OPUS do NIST

Tworzenie plików mowy NIST SPHERE z audio OPUS

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standard badań mowy

NIST SPHERE jest wymagany przez zestawy narzędzi ASR — twórz prawidłowo sformatowane pliki z nagrań OPUS.

Wyjście gotowe na korpus

Generuj pliki SPHERE z poprawnymi nagłówkami do trenowania i analizy rozpoznawania mowy.

Przetwarzanie online

Nie potrzebujesz instalacji zestawu narzędzi — konwertuj OPUS do NIST SPHERE w przeglądarce.

Jak przekonwertować plik w formacie OPUS do formatu NIST

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.

O formatach

Opus to wszechstronny, otwarty kodek audio standaryzowany przez IETF jako RFC 6716 w 2012 roku. Laczy dwa podejscia do kodowania — SILK dla mowy i CELT dla muzyki — w jeden algorytm, ktory plynnie przelacza sie miedzy nimi w zaleznosci od typu tresci i szybkosci transmisji. Ta hybrydowa konstrukcja pozwala Opus przewyzszac praktycznie kazdy inny kodek w szerokim zakresie zastosowan: glos o niskim opoznieniu przy 6 kbps, muzyka wysokiej jakosci przy 128 kbps i wszystko pomiedzy. Obsluguje szybkosci transmisji od 6 do 510 kbps, czestotliwosci probkowania do 48 kHz i ramki tak male jak 2,5 ms, co daje mu najnizsze opoznienie algorytmiczne wsrod wszystkich glownych kodekow audio. Trzy zalety czynia Opus szczegolnie atrakcyjnym. Jest calkowicie wolny od tantiem i otwartorodlowy, usuwajac bariery licencyjne hamujace kodeki wlascicielskie. Osiaga transparentna jakosc przy mniej wiecej polowie szybkosci transmisji MP3 i pokonuje AAC przy rownowaznych przepustowosciach. A jego niskie opoznienie czyni go obowiazkowym kodekiem dla WebRTC, wiec kazda nowoczesna przegladarka jest wyposasona w dekoder Opus. WhatsApp, Discord, Zoom i YouTube polegaja na Opus w transmisji audio w czasie rzeczywistym.
Pierwsze wydanie: 11 września 2012
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.
Pierwsze wydanie: 1990

Często Zadawane Pytania

Dlaczego warto konwertować OPUS do NIST?

NIST SPHERE jest wymagany przez główne zestawy narzędzi do przetwarzania mowy. Badania lingwistyczne i trening ASR potrzebują audio w formacie SPHERE.

Co korzysta z NIST?

HTK, Kaldi, narzędzia ewaluacyjne NIST i akademickie korpusy mowy używają SPHERE jako głównego formatu audio.

Czy NIST to to samo co SPH?

Tak — oba odnoszą się do SPHERE (SPeech HEader Resources) zdefiniowanego przez National Institute of Standards and Technology.

Jakie częstotliwości próbkowania?

SPHERE zazwyczaj używa 8 lub 16 kHz — standardowe częstotliwości dla badań mowy telefonicznej i szerokopasmowej.

Czy mogę konwertować zbiorczo?

Wgraj cały zbiór danych mowy OPUS i konwertuj go do NIST SPHERE w jednej sesji.