Конвертер VOX в SPH

Преобразование Dialogic VOX в формат NIST SPHERE

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Готовность для исследований

NIST SPHERE — стандарт для речевых исследовательских данных. Ваши телефонные записи VOX становятся обучающим материалом.

Из телефонии в науку

Реальное аудио колл-центра в исследовательском формате — ценный ресурс для построения моделей распознавания речи.

Массовая обработка

Конвертируйте целые коллекции записей VOX в SPH для построения корпуса за одну сессию.

Как сконвертировать VOX в SPH

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите sph или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш sph-файл

О форматах

VOX — безголовочный аудиоформат на основе кодирования Dialogic ADPCM, широко применяемый в телефонии, системах интерактивного голосового ответа (IVR) и платформах голосовой почты с 1980-х годов. Каждый аудиосэмпл сжимается до 4 бит по алгоритму, разработанному Oki Electric и аппаратно реализованному на телефонных интерфейсных картах Dialogic Corporation. Файлы VOX обычно используют частоту дискретизации 6000 или 8000 Гц, создавая предельно компактные записи, оптимизированные для разборчивости речи, а не музыкальной точности. Поскольку формат не содержит заголовка, программе воспроизведения необходимо заранее знать частоту дискретизации и параметры кодирования — компромисс, снижающий накладные расходы, но требующий тщательного управления файлами. Главное преимущество VOX — эффективность хранения: одна минута голосовой записи при 8 кГц занимает около 240 КБ, что удобно для систем, хранящих тысячи голосовых подсказок. Dialogic ADPCM соответствует стандарту ITU-T G.726, обеспечивая совместимость телефонного оборудования разных производителей. Даже с переходом современных колл-центров на IP-системы с кодеками вроде Opus, обширные библиотеки записей VOX продолжают существовать в устаревших IVR-системах и архивах по всему миру.
Разработчик: Dialogic Corporation
Дата выпуска: 1983
SPH — расширение файлов, хранящих аудио в формате NIST SPHERE (SPeech HEader REsources), стандарте, созданном Национальным институтом стандартов и технологий США около 1990 года. Разработанный для речевых исследований, SPH-файл содержит 1024-байтовый ASCII-заголовок с метаданными — идентификаторами базы данных, количеством каналов, частотой дискретизации, порядком байтов и типом сжатия — делая каждую запись самоописывающейся. Аудиоданные — обычно 16-битная линейная ИКМ при 16 кГц, хотя допустимы другие конфигурации. Исследователи в NIST, DARPA и университетах по всему миру используют SPH для распространения речевых корпусов — TIMIT, Switchboard и коллекций LDC, лежащих в основе современных систем автоматического распознавания речи. Ключевое преимущество — человекочитаемый заголовок, позволяющий скриптам разбирать метаданные записи без бинарного декодирования. Строгая стандартизация формата также исключает неоднозначности при обмене данными между учреждениями и платформами. Поскольку SPH-файлы хранят несжатый PCM, они сохраняют полную точность аудио — критически важное свойство при обучении акустических моделей, где даже малые артефакты могут исказить результаты.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать VOX в SPH?

SPHERE — стандарт для речевых исследовательских корпусов. Конвертация VOX создаёт телефонные обучающие данные для систем распознавания речи.

Чем открыть файлы SPH?

Инструменты NIST SPHERE, SoX, HTK и Kaldi читают файлы SPH. Это стандартные утилиты в области речевых исследований.

Подходит ли телефонный VOX для исследований?

Реальное телефонное аудио ценно для обучения систем распознавания речи — оно отражает реальные условия телефонных разговоров.

Можно ли конвертировать пакетом для построения корпуса?

Загрузите несколько файлов VOX и конвертируйте в SPH одновременно — эффективный способ построения телефонных речевых корпусов.

SPH и NIST — это одно и то же?

Да — SPH является файловым расширением, а NIST обозначает организацию-создателя формата. Это один и тот же формат данных.