Конвертер VOX в NIST

Сохраните записи Dialogic VOX в формате NIST SPHERE

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Телефония в науку

Переведите аудио Dialogic IVR в стандартный формат речевых исследований NIST SPHERE.

Пакетная обработка

Создавайте исследовательские корпуса из VOX-библиотек за одну сессию.

Облачная обработка

Конвертация выполняется на наших серверах без локальных инструментов.

Как сконвертировать VOX в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

VOX — безголовочный аудиоформат на основе кодирования Dialogic ADPCM, широко применяемый в телефонии, системах интерактивного голосового ответа (IVR) и платформах голосовой почты с 1980-х годов. Каждый аудиосэмпл сжимается до 4 бит по алгоритму, разработанному Oki Electric и аппаратно реализованному на телефонных интерфейсных картах Dialogic Corporation. Файлы VOX обычно используют частоту дискретизации 6000 или 8000 Гц, создавая предельно компактные записи, оптимизированные для разборчивости речи, а не музыкальной точности. Поскольку формат не содержит заголовка, программе воспроизведения необходимо заранее знать частоту дискретизации и параметры кодирования — компромисс, снижающий накладные расходы, но требующий тщательного управления файлами. Главное преимущество VOX — эффективность хранения: одна минута голосовой записи при 8 кГц занимает около 240 КБ, что удобно для систем, хранящих тысячи голосовых подсказок. Dialogic ADPCM соответствует стандарту ITU-T G.726, обеспечивая совместимость телефонного оборудования разных производителей. Даже с переходом современных колл-центров на IP-системы с кодеками вроде Opus), обширные библиотеки записей VOX продолжают существовать в устаревших IVR-системах и архивах по всему миру.
Разработчик: Dialogic Corporation
Дата выпуска: 1983
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать VOX в NIST?

NIST SPHERE — стандарт для корпусов речевых исследований. Конвертация VOX готовит телефонные данные для ML и лингвистического анализа.

Чем можно открыть NIST?

HTK Toolkit, SoX и инструменты речевых исследований обрабатывают NIST SPHERE.

Подходит ли VOX для речевых исследований?

Телефонные записи — ценный материал для корпусов распознавания речи. NIST — стандартный контейнер.

Сохраняется ли качество?

NIST хранит аудио без потерь. Декодированные VOX-данные сохраняются полностью.

Можно ли конвертировать пакетом?

Да — создавайте корпуса NIST из библиотек VOX-записей за одну сессию.

Рейтинг VOX в NIST

5.0 (1 голосов)
Вам необходимо сконвертировать и скачать любой файл, чтобы оценить конвертацию!