Конвертер VOB в HTK

Извлеките аудио DVD VOB в речевой формат HTK онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

DVD в речевые данные

Извлеките диалоги из DVD VOB и сохраните как HTK — готово для обучения Hidden Markov Model и акустического анализа.

Серверное извлечение

VOB-файлы могут быть большими. Наши серверы выполняют извлечение и HTK-кодирование — локальная установка инструментов не нужна.

Защита данных

Загрузки VOB удаляются после конвертации. HTK-вывод удаляется в течение 24 часов — ваши исследовательские данные остаются конфиденциальными.

Как сконвертировать VOB в HTK

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите htk или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш htk-файл

О форматах

VOB (Video Object) — основной контейнерный формат на дисках DVD-Video, определённый в составе спецификации DVD, разработанной DVD Forum. Формат впервые появился вместе со стандартом DVD, утверждённым в сентябре 1996 года, и с тех пор использовался на миллиардах DVD-дисков по всему миру. Файлы VOB основаны на программном потоке MPEG-2 и содержат мультиплексированное видео MPEG-2 со звуком в форматах AC-3 (Dolby Digital), DTS, MPEG-1 Layer II или LPCM. Помимо аудио и видео, файлы VOB несут дорожки субтитров DVD в виде растровых наложений, навигационные данные для взаимодействия с меню и информацию о точках глав. Файлы располагаются в каталоге VIDEO_TS на DVD-диске; соглашения об именовании (VTS_01_1.VOB и т.д.) отражают структуру тайтлов и частей контента. Размер отдельных файлов VOB ограничен примерно 1 ГБ для соответствия требованиям файловой системы UDF, а более продолжительный контент бесшовно распределяется по нескольким файлам. Формат поддерживает разрешения NTSC (720x480) и PAL (720x576) при битрейтах до 9,8 Мбит/с для суммарного аудио и видео. Интеграция видео, многодорожечного аудио, субтитров и навигации в единый программный поток сделала VOB комплексным решением для потребительской доставки фильмов. Хотя стриминг и новые дисковые форматы вытеснили DVD для нового контента, VOB остаётся крайне актуальным для доступа к обширной библиотеке существующего DVD-контента.
Разработчик: DVD Forum
Дата выпуска: Сентябрь 1996
HTK — собственный контейнер волновых форм для Hidden Markov Model Toolkit, программного пакета, разработанного на инженерном факультете Кембриджского университета для исследований в области распознавания речи. Впервые выпущенный в 1993 году, HTK быстро стал эталонной платформой в лабораториях компьютерной лингвистики по всему миру, и его файловый формат последовал тому же пути. Каждый файл хранит последовательность параметрических векторов или сырых сэмплов с 12-байтовым заголовком, определяющим число кадров, период кадра в единицах по 100 нс, количество байтов на кадр и код типа данных — от PCM-волновых форм до мел-частотных кепстральных коэффициентов и энергий фильтровых банков. Эта универсальность позволяет одному контейнеру нести как исходное аудио, так и извлечённые признаки без смены парсера. Намеренно минимальный заголовок без дополнительных отступов и опциональных чанков делает формат элементарным для чтения из C, Python или MATLAB несколькими строками бинарного ввода-вывода. Три преимущества обосновывают актуальность HTK: тесная интеграция с конвейером обучения и распознавания HTK, детерминированная байтовая разметка, исключающая неоднозначности парсера, и широкое распространение в академических корпусах.
Дата выпуска: 1993

Часто задаваемые вопросы

Зачем конвертировать VOB в HTK?

HTK — формат для Hidden Markov Model Toolkit. DVD VOB-файлы с диалогами становятся обучающими данными для исследований распознавания речи.

Что такое HTK-аудио?

HTK хранит одноканальный 16-битный PCM. Специально создан для Кембриджского HTK-фреймворка для анализа и распознавания речи.

Работает ли VOB-объёмный звук?

HTK монофонический. DVD-многоканальный звук из VOB сводится в один канал — стандартная процедура для работы с обработкой речи.

Сохраняется ли качество диалога?

HTK хранит несжатый 16-битный PCM. Диалоги из DVD VOB сохраняют полную чёткость для обучения распознаванию и анализа.

Можно ли обработать много VOB-глав?

Загрузите несколько VOB-файлов и пакетно конвертируйте в HTK. Создайте датасет из целого DVD за одну операцию.