Конвертер OGG в NIST

Создайте речевые файлы NIST SPHERE из OGG-аудио

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Стандарт речевых исследований

NIST SPHERE необходим крупнейшим инструментам обработки речи — создайте корректно форматированные файлы из OGG-записей.

Готово для корпуса

Сгенерируйте SPHERE-файлы с правильными заголовками, готовые для обучения распознавания речи и лингвистического анализа.

Онлайн-обработка

Установка речевого тулкита не требуется — конвертируйте OGG в NIST SPHERE прямо через браузер.

Как сконвертировать OGG в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

OGG Vorbis — открытый бесплатный аудиокодек с потерями внутри контейнера Ogg, оба разработаны Xiph.Org Foundation. Vorbis создавался как свободная от патентов альтернатива MP3 и AAC, используя модифицированное дискретное косинусное преобразование (MDCT) с кодированием переменного битрейта, адаптирующимся к сложности сигнала в каждом кадре. Слепые прослушивания неизменно показывают, что Vorbis обеспечивает перцептивное качество, сопоставимое с MP3 или превосходящее его, особенно в диапазоне 96-192 кбит/с. Формат поддерживает частоты дискретизации от 8 кГц до 192 кГц и от 1 до 255 каналов, охватывая всё — от моно-голоса до многоканальных миксов. Выдающееся преимущество — полное отсутствие лицензионных отчислений: разработчики игр, стриминговые платформы и производители оборудования могут внедрять Vorbis без забот о роялти. Spotify годами использовал Vorbis как основной стриминговый кодек именно по этой причине. Формат также более изящно справляется с деградацией качества на низких битрейтах, чем многие конкуренты, поэтому он остаётся популярным в видеоиграх, где хранилище ограничено, а тысячи звуковых эффектов соперничают за место. VLC, Firefox, Chrome и Android обеспечивают нативное декодирование Vorbis.
Разработчик: Xiph.Org Foundation
Дата выпуска: 1 мая 2000 г.
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать OGG в NIST?

NIST SPHERE — стандартный формат для речевых исследовательских датасетов. Лингвистические инструменты и конвейеры обучения ASR ожидают аудио в формате SPHERE.

Что использует NIST?

HTK, Kaldi, средства оценки речи NIST и академические речевые корпуса используют SPHERE в качестве основного аудиоформата.

NIST и SPHERE — одно и то же?

Да — NIST SPHERE (SPeech HEader Resources) определён Национальным институтом стандартов и технологий для речевых исследований.

Какие частоты дискретизации поддерживает NIST?

SPHERE-файлы обычно используют 8 или 16 кГц — стандартные частоты для телефонии и широкополосных речевых исследований.

Можно ли конвертировать пакетом?

Загрузите весь речевой датасет в OGG и конвертируйте его в NIST SPHERE за один раз — готово для исследовательских конвейеров.