Конвертер SPX в HTK

Преобразуйте записи Speex в формат распознавания речи HTK

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Аудио для исследований

Конвертируйте голосовые записи Speex в формат HTK — готовые данные для обучения, тестирования и акустических исследований.

Инструмент для науки о речи

Свяжите VoIP-записи в SPX с форматом HTK, используемым ведущими исследовательскими группами в области распознавания речи.

Безопасность данных

Ваши голосовые данные SPX удаляются после конвертации. HTK-результаты стираются с серверов в течение 24 часов.

Как сконвертировать SPX в HTK

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите htk или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш htk-файл

О форматах

Speex — аудиокодек с открытым исходным кодом, специально разработанный для сжатия речи Жан-Марком Валеном под эгидой Xiph.Org Foundation. Впервые выпущенный в октябре 2002 года, он ориентирован на VoIP, конференц-связь и любые сценарии, где голос нужно эффективно передавать по сети. SPX-файлы оборачивают Speex-кодированное аудио в контейнер Ogg, сочетая оптимизацию кодека для речи с возможностями потоковой передачи Ogg. Поддерживаются три частоты дискретизации — узкополосная 8 кГц, широкополосная 16 кГц и сверхширокополосная 32 кГц — а также кодирование с переменным битрейтом, адаптирующимся в реальном времени к сложности речи. Выдающееся преимущество — свободная от патентов лицензия BSD, позволившая разработчикам свободно встраивать кодек как в коммерческие, так и в открытые продукты. Speex также включает акустическое эхоподавление, шумоподавление и автоматическую регулировку усиления — функции, которые конкурирующие кодеки обычно делегируют внешним библиотекам. Хотя создатели кодека официально рекомендуют Opus как преемника с 2012 года, Speex остаётся в работе в устаревших VoIP-системах, архивных записях и встроенных устройствах, где ценится его лёгкий декодер.
Разработчик: Xiph.Org Foundation
Дата выпуска: 15 октября 2002 г.
HTK — собственный контейнер волновых форм для Hidden Markov Model Toolkit, программного пакета, разработанного на инженерном факультете Кембриджского университета для исследований в области распознавания речи. Впервые выпущенный в 1993 году, HTK быстро стал эталонной платформой в лабораториях компьютерной лингвистики по всему миру, и его файловый формат последовал тому же пути. Каждый файл хранит последовательность параметрических векторов или сырых сэмплов с 12-байтовым заголовком, определяющим число кадров, период кадра в единицах по 100 нс, количество байтов на кадр и код типа данных — от PCM-волновых форм до мел-частотных кепстральных коэффициентов и энергий фильтровых банков. Эта универсальность позволяет одному контейнеру нести как исходное аудио, так и извлечённые признаки без смены парсера. Намеренно минимальный заголовок без дополнительных отступов и опциональных чанков делает формат элементарным для чтения из C, Python или MATLAB несколькими строками бинарного ввода-вывода. Три преимущества обосновывают актуальность HTK: тесная интеграция с конвейером обучения и распознавания HTK, детерминированная байтовая разметка, исключающая неоднозначности парсера, и широкое распространение в академических корпусах.
Дата выпуска: 1993

Часто задаваемые вопросы

Зачем конвертировать SPX в HTK?

HTK — стандартный формат для инструментария Hidden Markov Model Toolkit, широко используемого в исследованиях распознавания речи и NLP.

Что такое инструментарий HTK?

HTK (Hidden Markov Model Toolkit) — фреймворк распознавания речи от Кембриджского университета, используемый в акустических исследованиях по всему миру.

Какому ПО нужны HTK-файлы?

Сам инструментарий HTK, Kaldi и различные академические фреймворки обработки речи принимают аудио в формате HTK.

Можно ли обучать модели на SPX-данных?

Да — речевые записи SPX, конвертированные в HTK, могут служить обучающими или оценочными данными для моделей распознавания речи.

Конвертация бесплатна?

Да — бесплатно на convertio.tools для стандартного использования.