Конвертер DIVX в SPH

Извлеките речевые данные NIST SPHERE из DIVX-видео онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Видео в речевой корпус

Извлекайте диалоги и речь из DIVX-видео прямо в формат SPHERE — без ручных шагов при составлении исследовательских аудионаборов.

Соответствие NIST

Выходные SPH-файлы следуют спецификации NIST SPHERE. Импортируйте их напрямую в Kaldi, HTK или другие фреймворки распознавания речи.

Облачная обработка

Извлечение аудио DIVX и кодирование SPH выполняются на наших серверах. Локальная установка инструментария SPHERE не требуется.

Как сконвертировать DIVX в SPH

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите sph или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш sph-файл

О форматах

DivX — семейство видеокодеков и медиаконтейнерный формат, разработанный компанией DivX, LLC. Истоки проекта восходят к взломанной версии кодека Microsoft MPEG-4 v3, распространявшейся в конце 1990-х, но легитимный кодек DivX появился в январе 2001 года как проект с открытым кодом OpenDivX, а затем стал проприетарным коммерческим продуктом. Кодек основан на сжатии MPEG-4 Part 2 (ASP), а более поздние версии включили поддержку H.264/AVC и HEVC. DivX приобрёл огромную популярность в начале 2000-х благодаря способности сжать полнометражный фильм в файл, умещающийся на одном CD-ROM, с сохранением приемлемого визуального качества. Такая эффективность сжатия сделала DivX определяющим форматом эпохи раннего интернета, когда полоса пропускания и хранилище были дефицитными ресурсами. Контейнер DivX Media Format (.divx) добавляет функции — интерактивные меню, главы, субтитры и альтернативные аудиодорожки, привнося DVD-подобную функциональность в цифровые файлы. Сертификация DivX стала распространённой маркировкой на бытовой электронике — тысячи DVD-проигрывателей и других устройств поддерживали воспроизведение DivX нативно. Кодек также стал пионером кодирования с переменным битрейтом на основе качества, выделяя больше данных сложным сценам и меньше — статичным, что обеспечивало стабильное визуальное качество на всём протяжении видео.
Разработчик: DivX, LLC
Дата выпуска: 15 января 2001 г.
SPH — расширение файлов, хранящих аудио в формате NIST SPHERE (SPeech HEader REsources), стандарте, созданном Национальным институтом стандартов и технологий США около 1990 года. Разработанный для речевых исследований, SPH-файл содержит 1024-байтовый ASCII-заголовок с метаданными — идентификаторами базы данных, количеством каналов, частотой дискретизации, порядком байтов и типом сжатия — делая каждую запись самоописывающейся. Аудиоданные — обычно 16-битная линейная ИКМ при 16 кГц, хотя допустимы другие конфигурации. Исследователи в NIST, DARPA и университетах по всему миру используют SPH для распространения речевых корпусов — TIMIT, Switchboard и коллекций LDC, лежащих в основе современных систем автоматического распознавания речи. Ключевое преимущество — человекочитаемый заголовок, позволяющий скриптам разбирать метаданные записи без бинарного декодирования. Строгая стандартизация формата также исключает неоднозначности при обмене данными между учреждениями и платформами. Поскольку SPH-файлы хранят несжатый PCM, они сохраняют полную точность аудио — критически важное свойство при обучении акустических моделей, где даже малые артефакты могут исказить результаты.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать DIVX в SPH?

SPH (SPHERE) — стандарт NIST для речевого аудио. Конвертация DIVX в SPH подготавливает диалоги из видео для лингвистических датасетов.

Какие инструменты читают SPH?

Kaldi, HTK, Praat и инструментарий NIST SPHERE поддерживают SPH-файлы. SoX также может обрабатывать этот формат.

SPH сохраняет качество звука?

SPH хранит PCM-аудио без сжатия. Речь, извлечённая из DIVX, сохраняет полное качество — необходимое для исследований и обучающих данных.

SPH и NIST — одно и то же?

Да — SPH и NIST обозначают формат SPHERE, стандартизированный Национальным институтом стандартов и технологий США для речевого аудио.

Можно обработать несколько DIVX?

Загружайте несколько DIVX-файлов и конвертируйте их в SPH сразу. Это ускоряет формирование речевых корпусов из видеоархивов.