Конвертер NIST в HTK

Конвертация аудио NIST в HTK прямо в браузере

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Полная защита

NIST-файлы удаляются сразу после конвертации, а HTK-результаты стираются с серверов в течение 24 часов.

Точная передача

Конвертация NIST в HTK сохраняет верность аудиоданных. Записи передаются чисто и точно.

Любое устройство

Запустите конвертер NIST в HTK на любой ОС через браузер — компьютер, ноутбук, планшет или смартфон.

Как сконвертировать NIST в HTK

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите htk или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш htk-файл

О форматах

NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990
HTK — собственный контейнер волновых форм для Hidden Markov Model Toolkit, программного пакета, разработанного на инженерном факультете Кембриджского университета для исследований в области распознавания речи. Впервые выпущенный в 1993 году, HTK быстро стал эталонной платформой в лабораториях компьютерной лингвистики по всему миру, и его файловый формат последовал тому же пути. Каждый файл хранит последовательность параметрических векторов или сырых сэмплов с 12-байтовым заголовком, определяющим число кадров, период кадра в единицах по 100 нс, количество байтов на кадр и код типа данных — от PCM-волновых форм до мел-частотных кепстральных коэффициентов и энергий фильтровых банков. Эта универсальность позволяет одному контейнеру нести как исходное аудио, так и извлечённые признаки без смены парсера. Намеренно минимальный заголовок без дополнительных отступов и опциональных чанков делает формат элементарным для чтения из C, Python или MATLAB несколькими строками бинарного ввода-вывода. Три преимущества обосновывают актуальность HTK: тесная интеграция с конвейером обучения и распознавания HTK, детерминированная байтовая разметка, исключающая неоднозначности парсера, и широкое распространение в академических корпусах.
Дата выпуска: 1993

Часто задаваемые вопросы

Зачем конвертировать NIST в HTK?

NIST SPHERE и HTK оба служат для исследования речи, но используют разные экосистемы инструментов. HTK интегрируется с тулкитом HTK.

Чем открыть файлы HTK?

HTK открывается в тулките распознавания речи HTK, SoX или исследовательских инструментах анализа речи.

Нужно ли специальное ПО?

Нет. Конвертация происходит онлайн — откройте браузер, загрузите NIST-файл и скачайте результат в HTK.

Сколько длится конвертация?

Обработка быстрая — обычно несколько секунд для стандартных записей NIST. Крупные файлы могут потребовать чуть больше.

На каких платформах работает?

На любых — Chrome, Firefox, Safari или Edge на любом настольном или мобильном устройстве.

Можно ли настроить параметры?

Да — частоту дискретизации, разрядность и каналы можно задать перед запуском конвертации NIST в HTK.