Konwerter AVI na SPH

Wyodrębnij audio z AVI do formatu mowy NIST SPHERE online

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

AVI na dane mowy

Przekształć audio z wideo AVI w dane mowy w formacie SPHERE, gotowe do korpusów lingwistycznych, treningu rozpoznawania i analizy akustycznej.

Przetwarzanie na serwerze

Ekstrakcja audio i kodowanie SPH odbywa się na naszych serwerach. Twój komputer pozostaje wolny — nie potrzebujesz instalacji lokalnego oprogramowania.

Gotowe do badań

Wyjście SPH z plików AVI spełnia specyfikacje NIST SPHERE. Importuj bezpośrednio do Kaldi, HTK i innych frameworków przetwarzania mowy.

Jak przekonwertować plik w formacie AVI do formatu SPH

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format sph lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu sph; od razu po konwersji możesz go pobrać.

O formatach

AVI (Audio Video Interleave) to jeden z najstarszych i najbardziej rozpoznawalnych formatow kontenerów multimedialnych, wprowadzony przez Microsoft w listopadzie 1992 roku jako czesc technologii Video for Windows. Zbudowany na strukturze Resource Interchange File Format (RIFF), AVI przeplata dane audio i wideo w naprzemiennych blokach, umozliwiajac zsynchronizowane odtwarzanie bez koniecznosci zaawansowanego zarzadzania strumieniami. Format jest niezalezny od kodeka, co oznacza, ze moze przechowywac wideo skompresowane praktycznie dowolnym kodekiem — od wczesnych Cinepak i Indeo po nowoczesne DivX, Xvid i strumienie H.264. Ta elastycznosc przyczynila sie do szerokiej adopcji na komputerach osobistych w latach 90. i 2000. Charakterystyczna cecha jest prosta struktura wewnetrzna, ktora sprawia, ze pliki AVI sa stosunkowo latwe do edycji i przetwarzania na poziomie binarnym w porownaniu z bardziej zlozonymi nowoczesnymi kontenerami. AVI obsluguje takze wiele sciezek audio, umozliwiajac wielojezyczne tresci w jednym pliku. Jednak oryginalna specyfikacja ma ograniczenia, w tym 2 GB limit rozmiaru pliku w starszych implementacjach i brak natywnej obslugi zmiennych szybkosci klatek czy zaawansowanych formatow napisow. Rozszerzenia OpenDML (AVI 2.0) rozwiazaly ograniczenie rozmiaru, pozwalajac plikom przekroczyc oryginalna granice. Mimo ze liczy sobie dziesieciolecia, AVI pozostaje jednym z najbardziej uniwersalnie rozpoznawalnych formatow multimedialnych i jest wciaz szeroko obslugiwany przez odtwarzacze mediow i narzedzia montazowe na wszystkich glownych systemach operacyjnych.
Twórca: Microsoft
Pierwsze wydanie: 10 listopada 1992
SPH to rozszerzenie plikow audio przechowywanych w formacie NIST SPHERE (SPeech HEader REsources) — standardzie stworzonym przez amerykanski National Institute of Standards and Technology okolo 1990 roku. Przeznaczony do badan nad mowa, pliki SPH zawieraja 1024-bajtowy naglowek ASCII wypelniony metadanymi — identyfikatorami bazy danych, liczba kanalow, czestotliwoscia probkowania, kolejnoscia bajtow i typem kompresji — co czyni kazde nagranie samoopisujoacy sie. Dane audio to zwykle 16-bitowe liniowe PCM probkowane przy 16 kHz, choc dozwolone sa inne konfiguracje. Badacze z NIST, DARPA i uniwersytetow na calym swiecie polegaja na SPH przy dystrybucji korpusow mowy, takich jak TIMIT, Switchboard i kolekcje LDC, ktore stanowia fundament nowoczesnych systemow automatycznego rozpoznawania mowy. Kluczowa zaleta jest to, ze czytelny naglowek pozwala skryptom parsowac metadane nagrania bez dekodowania binarnego. Scisla standaryzacja formatu eliminuje tez niejednoznacznosc przy wspoldzieleniu zbiorow danych miedzy instytucjami i platformami. Poniewaz pliki SPH przechowuja nieskompresowane PCM, zachowuja pelna wiernosc audio — co jest krytyczne przy trenowaniu modeli akustycznych, gdzie nawet drobne artefakty moga znieksztalcic wyniki.
Pierwsze wydanie: 1990

Często Zadawane Pytania

Dlaczego warto konwertować AVI na SPH?

SPH (SPHERE) to standard audio mowy od NIST stosowany w lingwistyce i rozpoznawaniu mowy. Konwersja AVI wyodrębnia dialogi do zbiorów danych badawczych.

Jakie narzędzia obsługują pliki SPH?

HTK, Kaldi, Praat i inne frameworki do analizy mowy odczytują SPH. Zestaw narzędzi NIST SPHERE również dostarcza natywne narzędzia do tego formatu.

Czy SPH to samo co NIST?

SPH i NIST odnoszą się do formatu SPHERE zdefiniowanego przez National Institute of Standards and Technology. Są funkcjonalnie identyczne.

Czy SPH obsługuje audio stereo?

Pliki SPHERE mogą przechowywać dane wielokanałowe, choć korpusy mowy zazwyczaj używają mono. Kanały audio z AVI są zachowane zgodnie z konfiguracją.

Czy mogę przetwarzać duże pliki AVI?

Nasze serwery obsługują pliki AVI różnych rozmiarów. Większe filmy mogą trwać nieco dłużej, ale ekstrakcja audio i kodowanie SPH pozostają niezawodne.