Конвертер NIST в SPX

Лёгкая конвертация речевых данных NIST в SPX

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в

Настройки

Установите общий выходной аудио битрейт для Speex. Разработанный для сжатия разговорной речи, Speex достигает прозрачности при сверхнизком битрейте с максимальным битрейтом в 44 кбит/с.
Установите количество аудиоканалов. Эта настройка наиболее полезна при понижающем микшировании каналов (например, с 5.1 до стерео).
Установите частоту дискретизации аудио. Музыка с полным спектром (20 Гц — 20 кГц) требует, для достижения прозрачности, значений не ниже 44,1 кГц. Дополнительную информацию можно найти в вики.

nist

NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
подробнее

spx

Speex — аудиокодек с открытым исходным кодом, специально разработанный для сжатия речи Жан-Марком Валеном под эгидой Xiph.Org Foundation. Впервые выпущенный в октябре 2002 года, он ориентирован на VoIP, конференц-связь и любые сценарии, где голос нужно эффективно передавать по сети. SPX-файлы оборачивают Speex-кодированное аудио в контейнер Ogg, сочетая оптимизацию кодека для речи с возможностями потоковой передачи Ogg. Поддерживаются три частоты дискретизации — узкополосная 8 кГц, широкополосная 16 кГц и сверхширокополосная 32 кГц — а также кодирование с переменным битрейтом, адаптирующимся в реальном времени к сложности речи. Выдающееся преимущество — свободная от патентов лицензия BSD, позволившая разработчикам свободно встраивать кодек как в коммерческие, так и в открытые продукты. Speex также включает акустическое эхоподавление, шумоподавление и автоматическую регулировку усиления — функции, которые конкурирующие кодеки обычно делегируют внешним библиотекам. Хотя создатели кодека официально рекомендуют Opus как преемника с 2012 года, Speex остаётся в работе в устаревших VoIP-системах, архивных записях и встроенных устройствах, где ценится его лёгкий декодер.
подробнее
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Верность исходнику

Транскодировка NIST в SPX даёт точный результат. Движок обрабатывает данные с высокой аккуратностью.

Быстрая конвертация

Оптимизированный конвейер моментально конвертирует NIST в SPX. Результат готов почти сразу.

Удалённая обработка

Конвертация NIST в SPX выполняется на удалённых серверах. Ваше устройство не нагружается.

Как сконвертировать NIST в SPX

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите spx или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш spx-файл

О форматах

NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990
Speex — аудиокодек с открытым исходным кодом, специально разработанный для сжатия речи Жан-Марком Валеном под эгидой Xiph.Org Foundation. Впервые выпущенный в октябре 2002 года, он ориентирован на VoIP, конференц-связь и любые сценарии, где голос нужно эффективно передавать по сети. SPX-файлы оборачивают Speex-кодированное аудио в контейнер Ogg, сочетая оптимизацию кодека для речи с возможностями потоковой передачи Ogg. Поддерживаются три частоты дискретизации — узкополосная 8 кГц, широкополосная 16 кГц и сверхширокополосная 32 кГц — а также кодирование с переменным битрейтом, адаптирующимся в реальном времени к сложности речи. Выдающееся преимущество — свободная от патентов лицензия BSD, позволившая разработчикам свободно встраивать кодек как в коммерческие, так и в открытые продукты. Speex также включает акустическое эхоподавление, шумоподавление и автоматическую регулировку усиления — функции, которые конкурирующие кодеки обычно делегируют внешним библиотекам. Хотя создатели кодека официально рекомендуют Opus как преемника с 2012 года, Speex остаётся в работе в устаревших VoIP-системах, архивных записях и встроенных устройствах, где ценится его лёгкий декодер.
Разработчик: Xiph.Org Foundation
Дата выпуска: 15 октября 2002 г.

Часто задаваемые вопросы

Зачем конвертировать NIST в SPX?

NIST хранит речь как необработанные исследовательские данные. Speex оптимизирован для сжатия речи — файлы компактнее при отличной чёткости голоса.

Чем открыть файлы SPX?

SPX воспроизводится в VLC, Audacity, Speex-совместимых приложениях или инструментах командной строки SoX.

Можно ли настроить параметры?

Да — частоту дискретизации, каналы и качество кодирования можно задать перед конвертацией NIST в SPX.

Повлияет ли конвертация на качество?

При выборе формата без потерь все данные сохраняются. Форматы с потерями незначительно уменьшают размер.

Доступна ли пакетная обработка?

Конечно. Загрузите несколько записей NIST и обработайте их все в SPX одним пакетом.

Конвертация безопасна?

Да — загруженные NIST-файлы стираются после обработки. SPX-файлы удаляются в течение 24 часов.