Konwerter VOB do HTK

Wyodrębnij audio z DVD VOB do formatu mowy HTK online

Upuść pliki tutaj. 1 GB Maksymalny rozmiar pliku lub Zapisz się
do
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Z DVD do danych mowy

Wyodrębnij dialogi z plików DVD VOB i zapisz jako HTK — gotowe do treningu Hidden Markov Model i badań analizy akustycznej.

Ekstrakcja po stronie serwera

Pliki VOB mogą być duże. Nasze serwery obsługują ekstrakcję i kodowanie HTK — nie jest wymagana lokalna instalacja zestawu narzędzi.

Ochrona danych

Przesłane pliki VOB są usuwane po konwersji. Wyjście HTK jest kasowane w ciągu 24 godzin — Twoje dane mowy do badań pozostają prywatne.

Jak przekonwertować plik w formacie VOB do formatu HTK

1

Wybierz pliki z komputera, dysku Google, usługi Dropbox, adresu URL lub po prostu przeciągnij plik na stronę.

2

Wybierz format htk lub inny potrzebny Ci format (spośród ponad 200 wspieranych formatów).

3

Poczekaj, aż plik zostanie przekonwertowany do formatu htk; od razu po konwersji możesz go pobrać.

O formatach

VOB (Video Object) to glowny format kontenera stosowany na plytach DVD-Video, zdefiniowany jako czesc specyfikacji DVD opracowanej przez DVD Forum. Format pojawil sie po raz pierwszy wraz ze standardem DVD sfinalizowanym we wrzesniu 1996 roku i od tego czasu zostal uzyty na miliardach plyt DVD wyprodukowanych na calym swiecie. Pliki VOB sa oparte na formacie strumienia programowego MPEG-2, zawierajac multipleksowane wideo MPEG-2 obok audio w formatach AC-3 (Dolby Digital), DTS, MPEG-1 Layer II lub LPCM. Poza audio i wideo pliki VOB przenossa rowniez strumienie napisow DVD jako nakladki bitmapowe, dane nawigacyjne do interakcji z menu i informacje o punktach rozdzialow. Pliki rezyduja w katalogu VIDEO_TS na plycie DVD, z konwencjami nazewnictwa (VTS_01_1.VOB itd.) odzwierciedlajacymi strukture tytulow i czesci tresci. Pojedynacze pliki VOB sa ograniczone do ok. 1 GB, aby spelnic wymagania systemu plikow UDF, a dluzsze tresci sa bezszwowo rozlozone na wiele plikow. Format obsluguje rozdzielczosci wideo NTSC (720x480) i PAL (720x576) przy szybkosciach transmisji do 9,8 Mbps dla laczonego audio i wideo. Integracja wideo, wieloscieezkowego audio, napisow i nawigacji w jednym strumieniu programowym uczynic VOB kompletnym rozwiazaniem do konsumenckiej dystrybucji filmow. Choc strumieniowanie i nowsze formaty nosnikow dyskowych zastapily DVD dla nowych tresci, VOB pozostaje niezwykle istotny do dostepu do ogromnej biblioteki istniejacych tresci DVD.
Twórca: DVD Forum
Pierwsze wydanie: Wrzesień 1996
HTK to natywny kontener fal dzwiekowych dla Hidden Markov Model Toolkit — pakietu oprogramowania opracowanego na Wydziale Inzynierii Uniwersytetu Cambridge do badan nad rozpoznawaniem mowy. Po raz pierwszy udostepniony w 1993 roku, HTK szybko stal sie platforma referencyjnaw laboratoriach lingwistyki obliczeniowej na calym swiecie, a jego format plikow poszedl w jego slady. Kazdy plik przechowuje sekwencje wektorow parametrow lub surowe probki, poprzedzone 12-bajtowym naglowkiem okreslajacym liczbe ramek, okres ramki w jednostkach 100 ns, liczbe bajtow na ramke oraz kod typu wskazujacy rodzaj danych — opcje obejmuja zarowno przebieg PCM, jak i wspolczynniki mel-czestotliwosciowe oraz energie pasma filtrowego. Ta wszechstronnosc pozwala pojedynczemu kontenerowi przenosic zarowno zrodlowe audio, jak i wyekstrahowane cechy bez zmiany parserow. Celowo minimalny naglowek unika wyrownan paddingu czy opcjonalnych blokow, co czyni format trywialnym do odczytu z C, Pythona czy MATLAB-a za pomoca kilku linii binarnego I/O. Trzy zalety stanowia o trwalym znaczeniu HTK: scisla integracja z potokiem trenowania i rozpoznawania HTK, deterministyczny uklad bajtow eliminujacy niejednoznacznosc parsera oraz szerokie przyjecie w korpusach akademickich.
Pierwsze wydanie: 1993

Często Zadawane Pytania

Dlaczego warto konwertować VOB do HTK?

HTK to format dla Hidden Markov Model Toolkit. Pliki DVD VOB z dialogami stają się danymi treningowymi mowy do badań rozpoznawania.

Czym jest audio HTK?

HTK przechowuje jednokanałowe 16-bitowe audio PCM. Jest celowo stworzony dla frameworka rozpoznawania i analizy mowy Cambridge HTK.

Czy audio surround z VOB działa?

HTK jest mono. Wielokanałowe audio z DVD VOB jest miksowane do jednego kanału — standardowa procedura w przetwarzaniu mowy.

Czy jakość dialogów jest zachowana?

HTK przechowuje nieskompresowane 16-bitowe PCM. Dialogi z plików DVD VOB zachowują pełną wyrazistość do treningu i analizy rozpoznawania.

Czy mogę przetworzyć wiele rozdziałów VOB?

Prześlij wiele plików VOB i skonwertuj je wsadowo do HTK. Zbuduj zestaw danych mowy z całego DVD w jednej operacji.