Конвертер OGG в SPH

Создайте исследовательское речевое аудио SPHERE из OGG

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Стандарт речевых корпусов

SPH — формат за крупнейшими речевыми датасетами. Конвертируйте OGG-записи в корректно форматированное исследовательское аудио.

Подготовка датасетов

Обработайте целые речевые OGG-коллекции в SPH одновременно — подготовьте исследовательский корпус за одну операцию.

Онлайн-конвертация

Установка речевого тулкита не требуется — создавайте SPH-файлы из OGG прямо через браузер.

Как сконвертировать OGG в SPH

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите sph или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш sph-файл

О форматах

OGG Vorbis — открытый бесплатный аудиокодек с потерями внутри контейнера Ogg, оба разработаны Xiph.Org Foundation. Vorbis создавался как свободная от патентов альтернатива MP3 и AAC, используя модифицированное дискретное косинусное преобразование (MDCT) с кодированием переменного битрейта, адаптирующимся к сложности сигнала в каждом кадре. Слепые прослушивания неизменно показывают, что Vorbis обеспечивает перцептивное качество, сопоставимое с MP3 или превосходящее его, особенно в диапазоне 96-192 кбит/с. Формат поддерживает частоты дискретизации от 8 кГц до 192 кГц и от 1 до 255 каналов, охватывая всё — от моно-голоса до многоканальных миксов. Выдающееся преимущество — полное отсутствие лицензионных отчислений: разработчики игр, стриминговые платформы и производители оборудования могут внедрять Vorbis без забот о роялти. Spotify годами использовал Vorbis как основной стриминговый кодек именно по этой причине. Формат также более изящно справляется с деградацией качества на низких битрейтах, чем многие конкуренты, поэтому он остаётся популярным в видеоиграх, где хранилище ограничено, а тысячи звуковых эффектов соперничают за место. VLC, Firefox, Chrome и Android обеспечивают нативное декодирование Vorbis.
Разработчик: Xiph.Org Foundation
Дата выпуска: 1 мая 2000 г.
SPH — расширение файлов, хранящих аудио в формате NIST SPHERE (SPeech HEader REsources), стандарте, созданном Национальным институтом стандартов и технологий США около 1990 года. Разработанный для речевых исследований, SPH-файл содержит 1024-байтовый ASCII-заголовок с метаданными — идентификаторами базы данных, количеством каналов, частотой дискретизации, порядком байтов и типом сжатия — делая каждую запись самоописывающейся. Аудиоданные — обычно 16-битная линейная ИКМ при 16 кГц, хотя допустимы другие конфигурации. Исследователи в NIST, DARPA и университетах по всему миру используют SPH для распространения речевых корпусов — TIMIT, Switchboard и коллекций LDC, лежащих в основе современных систем автоматического распознавания речи. Ключевое преимущество — человекочитаемый заголовок, позволяющий скриптам разбирать метаданные записи без бинарного декодирования. Строгая стандартизация формата также исключает неоднозначности при обмене данными между учреждениями и платформами. Поскольку SPH-файлы хранят несжатый PCM, они сохраняют полную точность аудио — критически важное свойство при обучении акустических моделей, где даже малые артефакты могут исказить результаты.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать OGG в SPH?

SPH (SPHERE) — формат NIST для речевых исследовательских датасетов. Конвейеры обучения ASR и лингвистические инструменты ожидают входные данные в формате SPHERE.

Что использует SPH?

Kaldi, HTK, средства оценки NIST и академические речевые корпуса, такие как TIMIT и Switchboard, используют SPHERE как аудиоформат.

SPH и NIST — одно и то же?

SPH и NIST оба обозначают формат SPHERE — SPeech HEader Resources, определённый Национальным институтом стандартов и технологий.

Какая частота дискретизации у SPH?

Речевые корпуса обычно используют 8 или 16 кГц. Конвертер автоматически передискретизирует OGG-источник.

Можно ли конвертировать целый датасет?

Загрузите пакет речевых OGG-записей и создайте SPH для каждого файла за раз — готово для ASR-исследований.

Рейтинг OGG в SPH

4.0 (1 голосов)
Вам необходимо сконвертировать и скачать любой файл, чтобы оценить конвертацию!