Конвертер SHN в HTK

Кодируйте Shorten-аудио в формат HTK для исследований речи онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Специализированный выход

Создавайте HTK из lossless SHN — чистое аудио для ваших исследовательских задач.

Онлайн-обработка

Специализированное ПО не нужно — наши серверы выполняют конвертацию SHN в HTK через ваш браузер.

Безопасность файлов

SHN-файлы удаляются сразу. HTK-результаты удаляются с серверов в течение 24 часов.

Как сконвертировать SHN в HTK

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите htk или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш htk-файл

О форматах

Shorten (SHN) — аудиокодек сжатия без потерь, созданный Тони Робинсоном в SoftSound и впервые опубликованный в 1993 году, что делает его одним из первых практических lossless-компрессоров. Алгоритм использует линейное предсказание для оценки каждого сэмпла по предшествующим, а затем кодирует остатки с помощью кодов Хаффмана или Голомба-Райса. Коэффициент сжатия обычно составляет от 2:1 до 3:1 с гарантией побитовой идентичности декодированного выхода оригиналу. Shorten приобрёл культурное значение в конце 1990-х как предпочтительный формат для обмена записями живых концертов — сообщества вроде etree.org выстроили целые сети распространения вокруг SHN-файлов, а группы вроде Grateful Dead и Phish негласно поддерживали эту практику. Одним из преимуществ была простота: кодирование и декодирование работали быстро даже на скромном оборудовании эпохи Pentium. Другой сильной стороной был детерминированный выход — один и тот же входной файл всегда давал одинаковые байты, что делало контрольные суммы надёжным инструментом проверки целостности среди тысяч участников обмена. Хотя FLAC в итоге вытеснил Shorten благодаря лучшему сжатию, поддержке поиска и встроенным метаданным, SHN сохраняет историческое значение, и обширные архивы живой музыки в этом формате продолжают циркулировать.
Разработчик: Tony Robinson / SoftSound
Дата выпуска: 1993
HTK — собственный контейнер волновых форм для Hidden Markov Model Toolkit, программного пакета, разработанного на инженерном факультете Кембриджского университета для исследований в области распознавания речи. Впервые выпущенный в 1993 году, HTK быстро стал эталонной платформой в лабораториях компьютерной лингвистики по всему миру, и его файловый формат последовал тому же пути. Каждый файл хранит последовательность параметрических векторов или сырых сэмплов с 12-байтовым заголовком, определяющим число кадров, период кадра в единицах по 100 нс, количество байтов на кадр и код типа данных — от PCM-волновых форм до мел-частотных кепстральных коэффициентов и энергий фильтровых банков. Эта универсальность позволяет одному контейнеру нести как исходное аудио, так и извлечённые признаки без смены парсера. Намеренно минимальный заголовок без дополнительных отступов и опциональных чанков делает формат элементарным для чтения из C, Python или MATLAB несколькими строками бинарного ввода-вывода. Три преимущества обосновывают актуальность HTK: тесная интеграция с конвейером обучения и распознавания HTK, детерминированная байтовая разметка, исключающая неоднозначности парсера, и широкое распространение в академических корпусах.
Дата выпуска: 1993

Часто задаваемые вопросы

Что такое HTK?

HTK — специализированный аудиоформат для Hidden Markov Model Toolkit, используемого в исследованиях распознавания речи.

Зачем конвертировать SHN в HTK?

Конкретные приложения требуют HTK-файлы. Lossless SHN обеспечивает чистый исходный материал без артефактов для конвертации.

Чем работать с HTK?

Специализированные инструменты, SoX и профессиональное ПО поддерживают обработку и воспроизведение HTK.

Сохраняется ли качество?

Lossless SHN-источник гарантирует отсутствие артефактов предшествующего сжатия — качество зависит от возможностей HTK.

Конвертация безопасна?

SHN-файлы удаляются сразу после конвертации. HTK-результаты удаляются с серверов в течение 24 часов.