Konwerter OGG do SPH

Utwórz pliki audio SPHERE do badań mowy z OGG

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Standard korpusów mowy

SPH to format stojący za głównymi zbiorami danych mowy — konwertuj nagrania OGG na poprawnie sformatowane audio badawcze.

Przygotowanie zbiorów

Przetwarzaj całe kolekcje nagrań OGG do SPH jednocześnie — przygotuj korpusy badawcze w jednej operacji.

Konwersja online

Nie potrzebujesz instalować narzędzi do przetwarzania mowy — twórz pliki SPH z OGG bezpośrednio w przeglądarce.

Jak przekonwertować plik w formacie OGG do formatu SPH

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format sph lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu sph; od razu po konwersji możesz go pobrać.

O formatach

OGG Vorbis to otwarty, wolny od tantiem stratny kodek audio wewnatrz kontenera Ogg, oba opracowane przez Xiph.Org Foundation. Vorbis zostal zaprojektowany jako wolna od patentow alternatywa dla MP3 i AAC, wykorzystujac zmodyfikowana dyskretna transformate kosinusowa (MDCT) z kodowaniem o zmiennej szybkosci transmisji, ktore dostosowuje sie do zlozonosci sygnalu w kazdej ramce. Slepotesty sluchowe konsekwentnie wykazuja, ze Vorbis zapewnia jakosc percepcyjna dorownujaca lub przewyzszajaca MP3, szczegolnie w zakresie 96-192 kbps. Format obsluguje czestotliwosci probkowania od 8 kHz do 192 kHz i od 1 do 255 kanalow, pokrywajac wszystko — od mono mowy po miksy surround. Wyrozniajaca zaleta jest calkowity brak oplat licencyjnych — twoorcy gier, platformy streamingowe i producenci sprzetu moga implementowac Vorbis bez koniecznosci placenia tantiem. Spotify przez lata polegal na Vorbis jako glownym kodeku streamingowym wlasnie z tego powodu. Format radzi sobie tez z degradacja jakosci przy niskich szybkosciach transmisji bardziej elegancko niz wielu konkurentow, dlatego pozostaje popularny w grach wideo, gdzie pamiec jest ograniczona, a tysiace efektow dzwiekowych rywalizuja o miejsce. VLC, Firefox, Chrome i Android zapewniaja natywne dekodowanie Vorbis.
Pierwsze wydanie: 1 maja 2000
SPH to rozszerzenie plikow audio przechowywanych w formacie NIST SPHERE (SPeech HEader REsources) — standardzie stworzonym przez amerykanski National Institute of Standards and Technology okolo 1990 roku. Przeznaczony do badan nad mowa, pliki SPH zawieraja 1024-bajtowy naglowek ASCII wypelniony metadanymi — identyfikatorami bazy danych, liczba kanalow, czestotliwoscia probkowania, kolejnoscia bajtow i typem kompresji — co czyni kazde nagranie samoopisujoacy sie. Dane audio to zwykle 16-bitowe liniowe PCM probkowane przy 16 kHz, choc dozwolone sa inne konfiguracje. Badacze z NIST, DARPA i uniwersytetow na calym swiecie polegaja na SPH przy dystrybucji korpusow mowy, takich jak TIMIT, Switchboard i kolekcje LDC, ktore stanowia fundament nowoczesnych systemow automatycznego rozpoznawania mowy. Kluczowa zaleta jest to, ze czytelny naglowek pozwala skryptom parsowac metadane nagrania bez dekodowania binarnego. Scisla standaryzacja formatu eliminuje tez niejednoznacznosc przy wspoldzieleniu zbiorow danych miedzy instytucjami i platformami. Poniewaz pliki SPH przechowuja nieskompresowane PCM, zachowuja pelna wiernosc audio — co jest krytyczne przy trenowaniu modeli akustycznych, gdzie nawet drobne artefakty moga znieksztalcic wyniki.
Pierwsze wydanie: 1990

Często Zadawane Pytania

Dlaczego warto konwertować OGG do SPH?

SPH (SPHERE) to format zdefiniowany przez NIST do zbiorów danych badawczych mowy. Systemy treningowe ASR i narzędzia lingwistyczne oczekują danych w formacie SPHERE.

Co korzysta z plików SPH?

Kaldi, HTK, narzędzia ewaluacyjne NIST oraz akademickie korpusy mowy takie jak TIMIT i Switchboard używają SPHERE jako formatu audio.

Czy SPH to to samo co NIST?

SPH i NIST odnoszą się do tego samego formatu SPHERE — SPeech HEader Resources zdefiniowanego przez National Institute of Standards and Technology.

Jakiej częstotliwości próbkowania używa SPH?

Korpusy mowy zazwyczaj stosują 8 lub 16 kHz. Konwerter automatycznie dostosuje próbkowanie ze źródła OGG.

Czy mogę konwertować cały zbiór danych?

Wgraj partię nagrań OGG i wygeneruj plik SPH dla każdego jednocześnie — przygotuj korpus badawczy w jednej operacji.

Ocena jakości od OGG do SPH

4.0 (1 głosów)
Aby przesłać opinię, musisz przekonwertować i pobrać co najmniej 1 plik!