Конвертер MPG в SPH

Получите аудио NIST Sphere из MPG для речевых корпусов онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Стандарт речевых исследований

SPH (Sphere) — базовый формат для речевых корпусов. Извлекайте аудио из MPG в форме, ожидаемой лингвистическими и ASR-инструментами.

Облачная работа

Извлечение аудио выполняется на серверах — никаких локальных NIST-инструментов для получения Sphere-файлов не нужно.

Приватность данных

Загруженные MPG удаляются после конвертации. SPH-результаты стираются с серверов в течение 24 часов.

Как сконвертировать MPG в SPH

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите sph или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш sph-файл

О форматах

MPG — распространённое расширение для видеофайлов, закодированных по стандартам сжатия MPEG-1 или MPEG-2, разработанным Moving Picture Experts Group. Трёхсимвольное расширение появилось из-за ограничений ранних файловых систем Windows и DOS, допускавших расширения не длиннее трёх символов, как сокращение полного обозначения MPEG. Файлы MPG содержат программные потоки MPEG, мультиплексирующие один видео- и один или несколько аудиопотоков в единый байтовый поток с метками синхронизации. Формат широко использовался в 1990-х и 2000-х для хранения цифрового видео на персональных компьютерах — от рипов Video CD и извлечений с DVD до записей цифрового ТВ с помощью аппаратных кодирующих карт. Файлы MPG со сжатием MPEG-1 обычно содержат видео 352x240 (NTSC) или 352x288 (PAL) при битрейтах около 1,5 Мбит/с, тогда как MPG с кодированием MPEG-2 поддерживает более высокие разрешения вплоть до Full HD. Программный поток предполагает относительно надёжный носитель хранения, в отличие от транспортного потока для вещания, что обеспечивает эффективное файловое воспроизведение без накладных расходов на восстановление после ошибок. Широкая совместимость — одна из непреходящих сильных сторон формата: практически любой медиаплеер на всех операционных системах декодирует такие файлы без установки дополнительных кодеков. MPG по-прежнему встречается в архивах видеоконтента, записях систем наблюдения и устаревших цифровых видеопроцессах.
Разработчик: Moving Picture Experts Group
Дата выпуска: Август 1993
SPH — расширение файлов, хранящих аудио в формате NIST SPHERE (SPeech HEader REsources), стандарте, созданном Национальным институтом стандартов и технологий США около 1990 года. Разработанный для речевых исследований, SPH-файл содержит 1024-байтовый ASCII-заголовок с метаданными — идентификаторами базы данных, количеством каналов, частотой дискретизации, порядком байтов и типом сжатия — делая каждую запись самоописывающейся. Аудиоданные — обычно 16-битная линейная ИКМ при 16 кГц, хотя допустимы другие конфигурации. Исследователи в NIST, DARPA и университетах по всему миру используют SPH для распространения речевых корпусов — TIMIT, Switchboard и коллекций LDC, лежащих в основе современных систем автоматического распознавания речи. Ключевое преимущество — человекочитаемый заголовок, позволяющий скриптам разбирать метаданные записи без бинарного декодирования. Строгая стандартизация формата также исключает неоднозначности при обмене данными между учреждениями и платформами. Поскольку SPH-файлы хранят несжатый PCM, они сохраняют полную точность аудио — критически важное свойство при обучении акустических моделей, где даже малые артефакты могут исказить результаты.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать MPG в SPH?

SPH (NIST Sphere) — стандартный формат речевых исследовательских корпусов. Конвертация даёт аудио, совместимое с лингвистическими инструментами.

Что работает с SPH-файлами?

NIST speech tools, корпуса LDC, Kaldi и HTK — фреймворки распознавания речи, работающие с форматом Sphere без дополнительных конвертаций.

Содержит ли SPH метаданные?

Да. Sphere-файлы имеют текстовый заголовок с частотой, кодированием, числом каналов и настраиваемыми полями метаданных.

Подходит ли SPH для обычного прослушивания?

SPH — исследовательский формат. Для прослушивания конвертируйте в WAV или MP3. SPH оптимален для конвейеров анализа речи.

Можно создавать наборы данных пакетно?

Да. Загрузите несколько MPG и за одну сессию соберите набор SPH-файлов для исследовательского корпуса.