Конвертер MPEG в NIST

Создайте NIST SPHERE аудио из MPEG-видеофайлов онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Соответствие стандартам

NIST SPHERE-вывод следует спецификациям Национального института стандартов и технологий — совместим со всеми основными ASR-исследовательскими фреймворками.

MPEG в NIST напрямую

Переходите от MPEG-видео к NIST-речевому аудио за один шаг. Ручное извлечение аудио или промежуточная конвертация не нужны.

На основе браузера

Инструментарий SPHERE или MPEG-декодеры локально не нужны. Конвертируйте MPEG в NIST через браузер на любом устройстве или платформе.

Как сконвертировать MPEG в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

MPEG (MPEG-1) — основополагающий стандарт сжатия видео и аудио, опубликованный в августе 1993 года группой Moving Picture Experts Group как ISO/IEC 11172. Это первый международный стандарт сжатия движущихся изображений и сопутствующего звука с потерями, заложивший принципы и методы, повлиявшие на все последующие видеокодеки. Сжатие видео MPEG-1 достигается комбинацией предсказания с компенсацией движения, кодирования на основе дискретного косинусного преобразования и энтропийного кодирования переменной длины, организованных вокруг трёх типов кадров: I-кадры (внутрикодированные), P-кадры (предсказанные) и B-кадры (двунаправленно-предсказанные). Стандарт рассчитан на битрейт около 1,5 Мбит/с для совокупного аудио и видео, обеспечивая качество, сопоставимое с VHS при разрешении SIF (352x240 для NTSC). Этот уровень сжатия был специально подобран под пропускную способность однократных CD-ROM-приводов, что позволило создать формат Video CD, принёсший цифровое видео потребителям в начале 1990-х. Аудиокомпонент, в частности Layer III (MP3), стал самым влиятельным аудиоформатом в истории. Структура кадров I/P/B, подход к оценке движения и блочное преобразование установили архитектурный шаблон, которому следовали все последующие крупные видеокодеки — от MPEG-2 до H.264 и далее. Хотя по эффективности сжатия MPEG-1 давно превзойдён, он поддерживается практически любым медиапрограммным обеспечением.
Разработчик: Moving Picture Experts Group
Дата выпуска: Август 1993
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать MPEG в NIST?

NIST SPHERE — эталонный формат для распространения речевых данных. Диалог MPEG-видео становится стандартизированным аудио для исследований распознавания речи.

Чем NIST отличается от SPH?

Это один и тот же формат — SPHERE от Национального института стандартов и технологий. NIST и SPH — взаимозаменяемые расширения.

NIST поддерживает качество MPEG?

NIST хранит PCM без сжатия. Аудио из MPEG сохраняется в полном качестве независимо от исходного кодирования MPEG.

Какие ASR-инструменты принимают NIST?

Kaldi, HTK, оценочные фреймворки NIST и большинство академических речевых лабораторий используют NIST SPHERE в качестве стандартного входного формата.

Доступна ли пакетная обработка?

Да — загрузите несколько MPEG-видео и конвертируйте все в NIST за раз. Удобно для создания корпусов из видеоархивов.