Конвертер DSS в HTK

Преобразование диктовок Olympus DSS в HTK онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Диктовки в HTK

Извлеките DSS-записи из проприетарного ПО Olympus/Philips — конвертируйте в HTK для исследований распознавания речи.

Без специального ПО

Откажитесь от Olympus DSS Player и Philips SpeechExec. Конвертация DSS в HTK происходит прямо в браузере.

Безопасность файлов

Загруженные DSS-файлы удаляются сразу после конвертации. Результаты стираются с серверов в течение 24 часов.

Как сконвертировать DSS в HTK

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите htk или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш htk-файл

О форматах

DSS (Digital Speech Standard) — проприетарный формат голосовой записи, разработанный компаниями Olympus, Philips и Grundig в 1994 году через International Voice Association. Созданный для рабочих процессов диктовки, DSS применяет оптимизированное для речи сжатие при очень низких битрейтах — оригинальный стандарт кодирует примерно при 13,7 кбит/с, а DSS Pro достигает около 28 кбит/с с улучшенной чёткостью. Кодек концентрирует свой бюджет на частотных диапазонах, характерных для человеческой речи, а не на полном спектре, создавая исключительно компактные файлы. Профессиональные рекордеры Olympus и Philips используют DSS нативно, интегрируясь с программами транскрибирования, которые поддерживают флаги приоритета, закладки и идентификацию автора в метаданных файла. Одно из преимуществ — эффективность по размеру: час диктовки занимает всего 6-12 МБ, что практично для высоконагруженных сред вроде больниц, юридических фирм и судов. Встроенные метаданные обеспечивают бесшовную маршрутизацию через очереди транскрибирования с автоматической сортировкой по приоритету. Хотя DSS — закрытый формат с воспроизведением только в совместимом ПО, его доминирование в профессиональной диктовке гарантирует постоянную поддержку со стороны основных платформ транскрибирования.
Разработчик: Olympus / Philips / Grundig
Дата выпуска: 1994
HTK — собственный контейнер волновых форм для Hidden Markov Model Toolkit, программного пакета, разработанного на инженерном факультете Кембриджского университета для исследований в области распознавания речи. Впервые выпущенный в 1993 году, HTK быстро стал эталонной платформой в лабораториях компьютерной лингвистики по всему миру, и его файловый формат последовал тому же пути. Каждый файл хранит последовательность параметрических векторов или сырых сэмплов с 12-байтовым заголовком, определяющим число кадров, период кадра в единицах по 100 нс, количество байтов на кадр и код типа данных — от PCM-волновых форм до мел-частотных кепстральных коэффициентов и энергий фильтровых банков. Эта универсальность позволяет одному контейнеру нести как исходное аудио, так и извлечённые признаки без смены парсера. Намеренно минимальный заголовок без дополнительных отступов и опциональных чанков делает формат элементарным для чтения из C, Python или MATLAB несколькими строками бинарного ввода-вывода. Три преимущества обосновывают актуальность HTK: тесная интеграция с конвейером обучения и распознавания HTK, детерминированная байтовая разметка, исключающая неоднозначности парсера, и широкое распространение в академических корпусах.
Дата выпуска: 1993

Часто задаваемые вопросы

Зачем конвертировать DSS в HTK?

HTK — формат инструментария для распознавания речи. Конвертация DSS-диктовок в HTK делает записи пригодными для исследований в области распознавания речи.

Чем открыть HTK-файлы?

HTK Toolkit, Kaldi и SoX открывают и воспроизводят HTK без дополнительных кодеков.

Где применяется формат DSS?

DSS (Digital Speech Standard) — формат диктовки от Olympus и Philips. Используется в профессиональных диктофонах для медицинских, юридических и корпоративных записей.

Сохранится ли качество голоса?

DSS — речевой кодек с узкой полосой пропускания. Конвертация передаёт всю разборчивость голоса из DSS в выходной HTK.

Можно ли конвертировать несколько DSS-файлов сразу?

Загрузите несколько DSS-записей и конвертируйте их все в HTK за один раз — идеально для подготовки данных к исследованиям.