Конвертер VOC в HTK

Перекодируйте Sound Blaster VOC в исследовательский HTK

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Исследовательский формат

Создавайте HTK из Sound Blaster VOC — речевые данные для исследований распознавания речи.

Подготовка данных

Конвертация VOC в HTK подготавливает аудиозаписи для обучения и оценки моделей распознавания речи.

Безопасная обработка

VOC-файлы удаляются немедленно. HTK-данные стираются в течение 24 часов.

Как сконвертировать VOC в HTK

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите htk или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш htk-файл

О форматах

VOC (Creative Voice) — цифровой аудиоконтейнер, разработанный компанией Creative Technology и представленный вместе с первой звуковой картой Sound Blaster в 1989 году. Он служил нативным аудиоформатом семейства Sound Blaster в эпоху DOS, когда оборудование Creative доминировало в сфере PC-аудио. Файлы VOC имеют блочную структуру: каждый файл состоит из типизированных блоков данных, способных нести 8-битный беззнаковый PCM, 4-битный и 2,6-битный Creative ADPCM, 16-битный знаковый PCM, а также звук в кодировках A-law и mu-law. Блочная структура также поддерживает интервалы тишины, циклы повторения и маркерные точки, предоставляя разработчикам игр точный контроль над воспроизведением звука. Важным преимуществом было аппаратное декодирование — карты Sound Blaster могли воспроизводить данные VOC напрямую через DMA-передачу, освобождая процессор в эпоху, когда каждый такт был на счету. Формат широко использовался в DOS-играх от id Software, Sierra и LucasArts. С распространением Windows и формата WAV VOC постепенно вышел из массового использования, однако остаётся важным для сохранения ретро-игр и работы с архивами винтажного PC-аудио.
Разработчик: Creative Technology
Дата выпуска: 1989
HTK — собственный контейнер волновых форм для Hidden Markov Model Toolkit, программного пакета, разработанного на инженерном факультете Кембриджского университета для исследований в области распознавания речи. Впервые выпущенный в 1993 году, HTK быстро стал эталонной платформой в лабораториях компьютерной лингвистики по всему миру, и его файловый формат последовал тому же пути. Каждый файл хранит последовательность параметрических векторов или сырых сэмплов с 12-байтовым заголовком, определяющим число кадров, период кадра в единицах по 100 нс, количество байтов на кадр и код типа данных — от PCM-волновых форм до мел-частотных кепстральных коэффициентов и энергий фильтровых банков. Эта универсальность позволяет одному контейнеру нести как исходное аудио, так и извлечённые признаки без смены парсера. Намеренно минимальный заголовок без дополнительных отступов и опциональных чанков делает формат элементарным для чтения из C, Python или MATLAB несколькими строками бинарного ввода-вывода. Три преимущества обосновывают актуальность HTK: тесная интеграция с конвейером обучения и распознавания HTK, детерминированная байтовая разметка, исключающая неоднозначности парсера, и широкое распространение в академических корпусах.
Дата выпуска: 1993

Часто задаваемые вопросы

Что такое HTK?

HTK — аудиоформат для Hidden Markov Model Toolkit — исследовательского фреймворка распознавания речи из Кембриджского университета.

Зачем конвертировать VOC в HTK?

Исследования распознавания речи с HMM Toolkit требуют HTK-формат. Конвертация VOC подготовит аудио для этих задач.

Что работает с HTK?

HTK-тулкит, академические инструменты и ПО анализа речи работают с аудиоформатом HTK.

HTK подходит для музыки?

Нет — HTK предназначен для исследований распознавания речи. Для музыки используйте FLAC или MP3.

Мои данные в безопасности?

VOC-файлы удаляются немедленно. HTK-результаты стираются в течение 24 часов.