Конвертер MPG в NIST

Извлеките NIST-аудио из MPG для исследований речи онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Официальный стандарт

Формат NIST используется в официальных бенчмарках распознавания речи. Извлеките MPG-аудио в формат, требуемый исследовательскими соревнованиями.

Удалённая обработка

Обработка ведётся на серверах — NIST-инструменты на локальной машине не нужны.

Безопасное извлечение

MPG-файлы удаляются сразу. NIST-вывод стирается с серверов в течение 24 часов.

Как сконвертировать MPG в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

MPG — распространённое расширение для видеофайлов, закодированных по стандартам сжатия MPEG-1 или MPEG-2, разработанным Moving Picture Experts Group. Трёхсимвольное расширение появилось из-за ограничений ранних файловых систем Windows и DOS, допускавших расширения не длиннее трёх символов, как сокращение полного обозначения MPEG. Файлы MPG содержат программные потоки MPEG, мультиплексирующие один видео- и один или несколько аудиопотоков в единый байтовый поток с метками синхронизации. Формат широко использовался в 1990-х и 2000-х для хранения цифрового видео на персональных компьютерах — от рипов Video CD и извлечений с DVD до записей цифрового ТВ с помощью аппаратных кодирующих карт. Файлы MPG со сжатием MPEG-1 обычно содержат видео 352x240 (NTSC) или 352x288 (PAL) при битрейтах около 1,5 Мбит/с, тогда как MPG с кодированием MPEG-2 поддерживает более высокие разрешения вплоть до Full HD. Программный поток предполагает относительно надёжный носитель хранения, в отличие от транспортного потока для вещания, что обеспечивает эффективное файловое воспроизведение без накладных расходов на восстановление после ошибок. Широкая совместимость — одна из непреходящих сильных сторон формата: практически любой медиаплеер на всех операционных системах декодирует такие файлы без установки дополнительных кодеков. MPG по-прежнему встречается в архивах видеоконтента, записях систем наблюдения и устаревших цифровых видеопроцессах.
Разработчик: Moving Picture Experts Group
Дата выпуска: Август 1993
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать MPG в NIST?

NIST — формат Национального института стандартов и технологий для оценки речи. Конвертация подготавливает аудио для официальных бенчмарков.

Чем NIST отличается от SPH?

NIST и SPH (Sphere) тесно связаны — оба используют формат NIST Sphere. Разница часто лишь в соглашениях о расширении файлов.

Что читает NIST-файлы?

Речевые инструменты NIST, sph2pipe, Kaldi и HTK обрабатывают NIST-аудио для распознавания и анализа речи.

NIST подходит для музыки?

Нет — NIST создан для речевых исследований. Для музыки выбирайте FLAC, MP3 или WAV.

Поддерживается пакетная конвертация?

Загрузите несколько MPG и извлеките NIST из каждого за одну сессию — эффективно для создания исследовательских датасетов.