Конвертер DSS в HTK

Преобразование диктовок Olympus DSS в HTK онлайн

Выберите файлы

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация

Диктовки в HTK

Извлеките DSS-записи из проприетарного ПО Olympus/Philips — конвертируйте в HTK для исследований распознавания речи.

Без специального ПО

Откажитесь от Olympus DSS Player и Philips SpeechExec. Конвертация DSS в HTK происходит прямо в браузере.

Безопасность файлов

Загруженные DSS-файлы удаляются сразу после конвертации. Результаты стираются с серверов в течение 24 часов.

Как сконвертировать DSS в HTK

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

Выберите htk или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш htk-файл

О форматах

DSS (Digital Speech Standard) — проприетарный формат голосовой записи, разработанный компаниями Olympus, Philips и Grundig в 1994 году через International Voice Association. Созданный для рабочих процессов диктовки, DSS применяет оптимизированное для речи сжатие при очень низких битрейтах — оригинальный стандарт кодирует примерно при 13,7 кбит/с, а DSS Pro достигает около 28 кбит/с с улучшенной чёткостью. Кодек концентрирует свой бюджет на частотных диапазонах, характерных для человеческой речи, а не на полном спектре, создавая исключительно компактные файлы. Профессиональные рекордеры Olympus и Philips используют DSS нативно, интегрируясь с программами транскрибирования, которые поддерживают флаги приоритета, закладки и идентификацию автора в метаданных файла. Одно из преимуществ — эффективность по размеру: час диктовки занимает всего 6-12 МБ, что практично для высоконагруженных сред вроде больниц, юридических фирм и судов. Встроенные метаданные обеспечивают бесшовную маршрутизацию через очереди транскрибирования с автоматической сортировкой по приоритету. Хотя DSS — закрытый формат с воспроизведением только в совместимом ПО, его доминирование в профессиональной диктовке гарантирует постоянную поддержку со стороны основных платформ транскрибирования.

Разработчик: Olympus / Philips / Grundig

Дата выпуска: 1994

HTK — собственный контейнер волновых форм для Hidden Markov Model Toolkit, программного пакета, разработанного на инженерном факультете Кембриджского университета для исследований в области распознавания речи. Впервые выпущенный в 1993 году, HTK быстро стал эталонной платформой в лабораториях компьютерной лингвистики по всему миру, и его файловый формат последовал тому же пути. Каждый файл хранит последовательность параметрических векторов или сырых сэмплов с 12-байтовым заголовком, определяющим число кадров, период кадра в единицах по 100 нс, количество байтов на кадр и код типа данных — от PCM-волновых форм до мел-частотных кепстральных коэффициентов и энергий фильтровых банков. Эта универсальность позволяет одному контейнеру нести как исходное аудио, так и извлечённые признаки без смены парсера. Намеренно минимальный заголовок без дополнительных отступов и опциональных чанков делает формат элементарным для чтения из C, Python или MATLAB несколькими строками бинарного ввода-вывода. Три преимущества обосновывают актуальность HTK: тесная интеграция с конвейером обучения и распознавания HTK, детерминированная байтовая разметка, исключающая неоднозначности парсера, и широкое распространение в академических корпусах.

Разработчик: Cambridge University Engineering Department

Дата выпуска: 1993

Часто задаваемые вопросы

Зачем конвертировать DSS в HTK?

HTK — формат инструментария для распознавания речи. Конвертация DSS-диктовок в HTK делает записи пригодными для исследований в области распознавания речи.

Чем открыть HTK-файлы?

HTK Toolkit, Kaldi и SoX открывают и воспроизводят HTK без дополнительных кодеков.

Где применяется формат DSS?

DSS (Digital Speech Standard) — формат диктовки от Olympus и Philips. Используется в профессиональных диктофонах для медицинских, юридических и корпоративных записей.

Сохранится ли качество голоса?

DSS — речевой кодек с узкой полосой пропускания. Конвертация передаёт всю разборчивость голоса из DSS в выходной HTK.

Можно ли конвертировать несколько DSS-файлов сразу?

Загрузите несколько DSS-записей и конвертируйте их все в HTK за один раз — идеально для подготовки данных к исследованиям.

Связанные конвертации

DSS в MP3

DSS в WAV

DSS в WMA

DSS в M4A

DSS в OGG

DSS в FLAC

DSS в AAC

DSS в CAF

DSS в WV

DSS в MP2

DSS в AMR

DSS в OPUS

DSS в SPX

DSS в VOC

DSS в AIFF

DSS в AC3

DSS в M4R

DSS в DTS

DSS в W64

DSS в TTA

DSS в RA

DSS в OGA

DSS в PVF

DSS в PRC

DSS в MAUD

DSS в 8SVX

DSS в AMB

DSS в AU

DSS в SND

DSS в SNDR

DSS в SNDT

DSS в AVR

DSS в CDDA

DSS в CVS

DSS в CVSD

DSS в CVU

DSS в DVMS

DSS в VMS

DSS в FAP

DSS в PAF

DSS в FSSD

DSS в SOU

DSS в GSRT

DSS в GSM

DSS в HCOM

DSS в HTK

DSS в IMA

DSS в IRCAM

DSS в SLN

DSS в SPH

DSS в NIST

DSS в SMP

DSS в TXW

DSS в VOX

DSS в WVE

DSS в SD2

Конвертеры форматов

MP3 в HTK

WAV в HTK

MP4 в HTK

FLAC в HTK

M4A в HTK

OGG в HTK

MPG в HTK

ASF в HTK

AAC в HTK

3G2 в HTK

3GP в HTK

AAF в HTK

AV1 в HTK

AVCHD в HTK

AVI в HTK

CAVS в HTK

DIVX в HTK

DV в HTK

F4V в HTK

FLV в HTK

HEVC в HTK

M2TS в HTK

M2V в HTK

M4V в HTK

MJPEG в HTK

MKV в HTK

MOD в HTK

MOV в HTK

MPEG в HTK

MPEG-2 в HTK