Конвертер VOC в NIST

Перекодируйте Sound Blaster VOC в формат NIST Sphere

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Оценка речи

NIST — стандарт бенчмарков распознавания речи. Конвертация VOC для исследовательских датасетов.

Подготовка данных

Конвертация Sound Blaster VOC в NIST для обучения и оценки моделей.

Онлайн-обработка

Не нужна установка NIST-тулкита — серверы выполняют конвертацию через браузер.

Как сконвертировать VOC в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

VOC (Creative Voice) — цифровой аудиоконтейнер, разработанный компанией Creative Technology и представленный вместе с первой звуковой картой Sound Blaster в 1989 году. Он служил нативным аудиоформатом семейства Sound Blaster в эпоху DOS, когда оборудование Creative доминировало в сфере PC-аудио. Файлы VOC имеют блочную структуру: каждый файл состоит из типизированных блоков данных, способных нести 8-битный беззнаковый PCM, 4-битный и 2,6-битный Creative ADPCM, 16-битный знаковый PCM, а также звук в кодировках A-law и mu-law. Блочная структура также поддерживает интервалы тишины, циклы повторения и маркерные точки, предоставляя разработчикам игр точный контроль над воспроизведением звука. Важным преимуществом было аппаратное декодирование — карты Sound Blaster могли воспроизводить данные VOC напрямую через DMA-передачу, освобождая процессор в эпоху, когда каждый такт был на счету. Формат широко использовался в DOS-играх от id Software, Sierra и LucasArts. С распространением Windows и формата WAV VOC постепенно вышел из массового использования, однако остаётся важным для сохранения ретро-игр и работы с архивами винтажного PC-аудио.
Разработчик: Creative Technology
Дата выпуска: 1989
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Что такое NIST?

NIST — спецификация аудиоформата от Национального института стандартов и технологий для речевых оценочных датасетов.

Зачем конвертировать VOC в NIST?

NIST требуется для бенчмарков распознавания речи. Конвертация VOC подготовит аудио для исследовательских целей.

Чем обработать NIST?

Kaldi, HTK, инструменты NIST и фреймворки распознавания речи работают с NIST-форматом.

NIST и SPH — разные?

Тесно связаны — оба используют спецификацию NIST Sphere. Некоторые инструменты обрабатывают их взаимозаменяемо.

Конвертация безопасна?

VOC-файлы удаляются сразу. NIST-результаты стираются в течение 24 часов.