Konwerter OGG do NIST

Twórz pliki mowy NIST SPHERE z audio OGG

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standard badań mowy

NIST SPHERE jest wymagany przez główne toolkit do przetwarzania mowy — twórz prawidłowo sformatowane pliki z nagrań OGG.

Gotowe do korpusu

Generuj pliki SPHERE z poprawnymi nagłówkami, gotowe do trenowania rozpoznawania mowy i analizy lingwistycznej.

Przetwarzanie online

Nie potrzebujesz instalacji toolkit mowy — konwertuj OGG do NIST SPHERE bezpośrednio w przeglądarce.

Jak przekonwertować plik w formacie OGG do formatu NIST

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format nist lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu nist; od razu po konwersji możesz go pobrać.

O formatach

OGG Vorbis to otwarty, wolny od tantiem stratny kodek audio wewnatrz kontenera Ogg, oba opracowane przez Xiph.Org Foundation. Vorbis zostal zaprojektowany jako wolna od patentow alternatywa dla MP3 i AAC, wykorzystujac zmodyfikowana dyskretna transformate kosinusowa (MDCT) z kodowaniem o zmiennej szybkosci transmisji, ktore dostosowuje sie do zlozonosci sygnalu w kazdej ramce. Slepotesty sluchowe konsekwentnie wykazuja, ze Vorbis zapewnia jakosc percepcyjna dorownujaca lub przewyzszajaca MP3, szczegolnie w zakresie 96-192 kbps. Format obsluguje czestotliwosci probkowania od 8 kHz do 192 kHz i od 1 do 255 kanalow, pokrywajac wszystko — od mono mowy po miksy surround. Wyrozniajaca zaleta jest calkowity brak oplat licencyjnych — twoorcy gier, platformy streamingowe i producenci sprzetu moga implementowac Vorbis bez koniecznosci placenia tantiem. Spotify przez lata polegal na Vorbis jako glownym kodeku streamingowym wlasnie z tego powodu. Format radzi sobie tez z degradacja jakosci przy niskich szybkosciach transmisji bardziej elegancko niz wielu konkurentow, dlatego pozostaje popularny w grach wideo, gdzie pamiec jest ograniczona, a tysiace efektow dzwiekowych rywalizuja o miejsce. VLC, Firefox, Chrome i Android zapewniaja natywne dekodowanie Vorbis.
Pierwsze wydanie: 1 maja 2000
NIST SPHERE (SPeech HEader REsources) to specjalistyczny format plikow audio stworzony przez National Institute of Standards and Technology na potrzeby badan nad mowa, w szczegolnosci projektow finansowanych przez DARPA. Format opakowuje surowe probki audio w strukturalny naglowek ASCII kodujacy metadane, takie jak czestotliwosc probkowania, liczba kanalow, typ kodowania, dane demograficzne mowcy i adnotacje transkrypcyjne — co czyni go idealnym do dystrybucji korpusow mowy. Pliki NIST zwykle przechowuja nieskompresowane PCM lub audio mu-law przy czestotliwosciach probkowania klasy telefonicznej (8 kHz lub 16 kHz), choc kontener jest na tyle elastyczny, by pomiescic rozne kodowania. Kluczowa zaleta jest bogaty, samoopisujoacy sie naglowek, pozwalajacy badaczom osadzac szczegolowe metadane korpusowe bezposrednio w pliku, eliminujac potrzebe osobnych plikow towarzyszacych. SPHERE stal sie rowniez de facto standardem dla glownych baz danych mowy, takich jak TIMIT, Switchboard i korpus Fisher, zapewniajac szerokie uznanie w laboratoriach akademickich i rzadowych. Otwarta specyfikacja i dostepnosc narzedzi wiersza polecen (sphere, h_strip, w_decode) umozliwiaja latwa konwersje, inspekcje i przetwarzanie tych plikow programistycznie w potokach przetwarzania mowy.
Pierwsze wydanie: 1990

Często Zadawane Pytania

Dlaczego warto konwertować OGG do NIST?

NIST SPHERE to standardowy format dla zbiorów danych badawczych mowy. Narzędzia lingwistyczne i pipeline trenowania ASR oczekują audio w formacie SPHERE.

Co wykorzystuje pliki NIST?

HTK, Kaldi, narzędzia ewaluacyjne NIST i akademickie korpusy badawcze mowy używają SPHERE jako głównego formatu audio.

Czy NIST to to samo co SPHERE?

Tak — NIST SPHERE (SPeech HEader Resources) został zdefiniowany przez National Institute of Standards and Technology do badań nad mową.

Jakie częstotliwości próbkowania obsługuje NIST?

Pliki SPHERE zwykle stosują 8 lub 16 kHz — standardowe częstotliwości dla badań mowy telefonicznej i szerokopasmowej.

Czy mogę skonwertować partię OGG do NIST?

Wgraj cały zbiór danych mowy OGG i skonwertuj go do NIST SPHERE w jednej partii — gotowy do pipeline badawczych.