Конвертер GSM в HTK

Подготовьте GSM-речь для исследовательского инструмента HTK онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Готово для исследований

Преобразуйте GSM-аудио в HTK — подготовьте записи для конвейера Hidden Markov Model Toolkit.

Академический стандарт

HTK — признанный формат для исследований распознавания речи. Конвертация GSM в HTK связывает телефонию и академический анализ.

Конфиденциальная обработка

Загруженные GSM-файлы стираются после обработки. HTK-результаты удаляются с серверов в течение 24 часов.

Как сконвертировать GSM в HTK

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите htk или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш htk-файл

О форматах

GSM 06.10 (Full Rate) — базовый речевой кодек стандарта глобальной системы мобильной связи, утверждённый ETSI в 1991 году и развёрнутый в сотнях сотовых сетей по всему миру. Работая на фиксированной скорости 13 кбит/с, алгоритм применяет регулярное импульсное возбуждение с долгосрочным предсказанием (RPE-LTP) для сжатия 20-миллисекундных кадров моно-речи при 8 кГц всего в 33 байта. Подход моделирует голосовой тракт как линейный предсказывающий фильтр, кодирует возбуждающий сигнал и использует периодичность основного тона для дальнейшего сокращения — всё настроено для передачи разборчивой речи при ограниченной полосе ранних цифровых мобильных каналов. Кодек используется не только в GSM-телефонии, но и во многих VoIP-приложениях, системах голосовой почты и IVR-платформах, извлекающих выгоду из низкого битрейта. Три конкретных преимущества выделяют его. Во-первых, выдающееся сжатие: минута речи помещается примерно в 100 КБ, обеспечивая эффективное хранение и передачу. Во-вторых, универсальный инструментарий — библиотеки libgsm и SoX выполняют кодирование и декодирование на всех основных платформах. В-третьих, свободный от роялти патентный ландшафт, способствовавший внедрению в проектах с открытым исходным кодом, таких как Asterisk и FreeSWITCH.
Дата выпуска: 1991
HTK — собственный контейнер волновых форм для Hidden Markov Model Toolkit, программного пакета, разработанного на инженерном факультете Кембриджского университета для исследований в области распознавания речи. Впервые выпущенный в 1993 году, HTK быстро стал эталонной платформой в лабораториях компьютерной лингвистики по всему миру, и его файловый формат последовал тому же пути. Каждый файл хранит последовательность параметрических векторов или сырых сэмплов с 12-байтовым заголовком, определяющим число кадров, период кадра в единицах по 100 нс, количество байтов на кадр и код типа данных — от PCM-волновых форм до мел-частотных кепстральных коэффициентов и энергий фильтровых банков. Эта универсальность позволяет одному контейнеру нести как исходное аудио, так и извлечённые признаки без смены парсера. Намеренно минимальный заголовок без дополнительных отступов и опциональных чанков делает формат элементарным для чтения из C, Python или MATLAB несколькими строками бинарного ввода-вывода. Три преимущества обосновывают актуальность HTK: тесная интеграция с конвейером обучения и распознавания HTK, детерминированная байтовая разметка, исключающая неоднозначности парсера, и широкое распространение в академических корпусах.
Дата выпуска: 1993

Часто задаваемые вопросы

Что такое HTK?

HTK — формат Hidden Markov Model Toolkit, академический стандарт для обработки речи, распознавания и фонетического анализа.

Зачем конвертировать GSM в HTK?

HTK-формат требуется ПО HMM Toolkit. Конвертация подготавливает GSM-записи телефонии для анализа в исследовательских конвейерах HTK.

Какое ПО работает с HTK?

Инструмент распознавания речи HTK от Кембриджского университета, Kaldi и аналогичные академические средства обрабатывают HTK-файлы.

HTK подходит для обычного аудио?

Нет. HTK — строго академический формат для исследования речи: одноканальный, 16 бит PCM, созданный для вычислительного анализа.

Мои исследовательские записи в тайне?

Все GSM-файлы удаляются после конвертации. HTK-результаты стираются с серверов в течение 24 часов.