Конвертер CDDA в HTK

Преобразуйте CD-аудио в формат распознавания речи HTK

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Формат для речевых исследований

Подготовьте CDDA для HTK — формат, ожидаемый Hidden Markov Model Toolkit для исследований распознавания речи.

Облачная обработка

Конвертация HTK выполняется на наших серверах. Установка HTK Toolkit не требуется — получите нужный формат мгновенно.

Входной сигнал CD-качества

Несжатый CDDA обеспечивает исследователям аудио наивысшей точности для извлечения признаков и обучения моделей.

Как сконвертировать CDDA в HTK

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите htk или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш htk-файл

О форматах

CDDA (Compact Disc Digital Audio), известный как стандарт Red Book, определяет аудио, хранимое на музыкальных компакт-дисках. Совместно разработанный Sony и Philips и опубликованный в 1980 году, он задал параметры, определившие цифровое аудио на десятилетия: 16-битная линейная ИКМ при 44,1 кГц в стерео, что даёт 1411,2 кбит/с без сжатия. Каждый диск вмещает до 80 минут, организованных в треки с индексными точками, субканальными данными для отображения текста и кодами коррекции ошибок (CIRC), обеспечивающими надёжное воспроизведение даже при незначительных царапинах. При извлечении аудио с CD полученный поток часто сохраняется с расширением .cdda как сырые PCM-данные перед конвертацией. Очевидное преимущество — несжатая, без потерь природа формата: то, что воспроизводится, математически идентично студийному мастеру при заданном разрешении. Надёжная коррекция ошибок обеспечивает отличную устойчивость, сохраняя целостность аудио даже при умеренном износе поверхности диска. Будучи проданным миллиардами экземпляров с момента первого коммерческого выпуска в 1982 году, CDDA установил базовые ожидания качества цифровой музыки и по сей день остаётся эталоном для оценки сжатых кодеков.
Разработчик: Sony / Philips
Дата выпуска: Октябрь 1980
HTK — собственный контейнер волновых форм для Hidden Markov Model Toolkit, программного пакета, разработанного на инженерном факультете Кембриджского университета для исследований в области распознавания речи. Впервые выпущенный в 1993 году, HTK быстро стал эталонной платформой в лабораториях компьютерной лингвистики по всему миру, и его файловый формат последовал тому же пути. Каждый файл хранит последовательность параметрических векторов или сырых сэмплов с 12-байтовым заголовком, определяющим число кадров, период кадра в единицах по 100 нс, количество байтов на кадр и код типа данных — от PCM-волновых форм до мел-частотных кепстральных коэффициентов и энергий фильтровых банков. Эта универсальность позволяет одному контейнеру нести как исходное аудио, так и извлечённые признаки без смены парсера. Намеренно минимальный заголовок без дополнительных отступов и опциональных чанков делает формат элементарным для чтения из C, Python или MATLAB несколькими строками бинарного ввода-вывода. Три преимущества обосновывают актуальность HTK: тесная интеграция с конвейером обучения и распознавания HTK, детерминированная байтовая разметка, исключающая неоднозначности парсера, и широкое распространение в академических корпусах.
Дата выпуска: 1993

Часто задаваемые вопросы

Зачем конвертировать CDDA в HTK?

HTK — нативный формат Hidden Markov Model Toolkit. Конвертация CDDA в HTK подготавливает аудио для обучения моделей распознавания речи.

Для чего используется HTK?

HTK — исследовательский инструментарий распознавания речи из Кембриджа. Его формат хранит аудиопризнаки и формы волн для обучения и оценки моделей.

Поддерживает ли HTK полное CD-качество?

HTK может хранить различные частоты дискретизации. Для распознавания речи обычно используется 16 кГц, но формат поддерживает и 44,1 кГц CDDA.

Какой софт читает HTK?

Сам HTK Toolkit, а также SoX и различные фреймворки обработки речи могут читать и записывать аудиоданные формата HTK.

Можно ли пакетно конвертировать?

Загрузите несколько CDDA-файлов и сконвертируйте все в HTK разом — эффективно для формирования речевых корпусов из CD-записей.