Конвертер AMB в HTK

Преобразуйте пространственное AMB-аудио в формат HTK

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Из пространственного в исследовательский

Переведите AMB Ambisonic-записи в HTK — подготовьте данные для обучения моделей распознавания речи.

Без специальных программ

Конвертируйте AMB в HTK в браузере без установки Ambisonic-плагинов и пространственных инструментов.

Моментальная обработка

Конвертация AMB в HTK выполняется на серверах. Записи обработаны и доступны для скачивания оперативно.

Как сконвертировать AMB в HTK

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите htk или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш htk-файл

О форматах

AMB-файлы содержат аудио, закодированное в формате Ambisonic B-format — технологии полносферического объёмного звучания, разработанной Майклом Герзоном в 1970-х годах. В отличие от канальных систем вроде 5.1 или 7.1, Ambisonics фиксирует полное трёхмерное звуковое поле с помощью сферических гармоник — B-формат первого порядка состоит из четырёх каналов: W (всенаправленный), X (вперёд-назад), Y (влево-вправо) и Z (вверх-вниз). Такое представление не привязано к конкретной конфигурации динамиков, и одна запись может быть декодирована для любой акустической системы или бинауральных наушников без перемикширования. AMB-файлы обычно хранят несжатые PCM-данные и обрабатываются инструментами вроде SoX или специализированных плагинов. Ключевое преимущество — пространственная гибкость: создатели делают один мастер-файл, адаптируемый под стерео, многоканальное или иммерсивное воспроизведение. Формат также легко масштабируется: Ambisonics высших порядков добавляет каналы для повышения пространственной точности на основе той же математической модели. С развитием виртуальной реальности, 360-градусного видео и пространственного аудио для игр Ambisonics переживает возрождение и используется такими платформами, как YouTube, для иммерсивного контента.
Разработчик: Michael Gerzon / Ambisonic Community
Дата выпуска: 1975
HTK — собственный контейнер волновых форм для Hidden Markov Model Toolkit, программного пакета, разработанного на инженерном факультете Кембриджского университета для исследований в области распознавания речи. Впервые выпущенный в 1993 году, HTK быстро стал эталонной платформой в лабораториях компьютерной лингвистики по всему миру, и его файловый формат последовал тому же пути. Каждый файл хранит последовательность параметрических векторов или сырых сэмплов с 12-байтовым заголовком, определяющим число кадров, период кадра в единицах по 100 нс, количество байтов на кадр и код типа данных — от PCM-волновых форм до мел-частотных кепстральных коэффициентов и энергий фильтровых банков. Эта универсальность позволяет одному контейнеру нести как исходное аудио, так и извлечённые признаки без смены парсера. Намеренно минимальный заголовок без дополнительных отступов и опциональных чанков делает формат элементарным для чтения из C, Python или MATLAB несколькими строками бинарного ввода-вывода. Три преимущества обосновывают актуальность HTK: тесная интеграция с конвейером обучения и распознавания HTK, детерминированная байтовая разметка, исключающая неоднозначности парсера, и широкое распространение в академических корпусах.
Дата выпуска: 1993

Часто задаваемые вопросы

Зачем конвертировать AMB в HTK?

HTK — формат для исследований в области распознавания речи. Конвертация AMB позволяет готовить данные для обучения речевых моделей.

Чем открыть HTK?

HTK Toolkit, Kaldi и SoX работают с HTK-файлами без установки дополнительных плагинов.

Пространственность сохраняется?

AMB хранит данные Ambisonic B-Format. При конвертации в HTK звук сводится в обычные каналы — 3D-кодирование теряется.

Что представляет собой AMB?

AMB содержит Ambisonic B-Format аудио для VR, 360-видео и иммерсивного пространственного звукового производства.

Доступна ли пакетная обработка?

Загрузите несколько AMB-файлов и конвертируйте все в HTK одновременно — удобная обработка набора данных.