Конвертер GSM в NIST

Закодируйте GSM-аудио в речевой формат NIST онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Исследовательский формат

Подготовьте GSM-записи для речевых исследований конвертацией в NIST — формат, ожидаемый академическими аналитическими инструментами.

Без установки инструментов

Обходитесь без локальной установки SPHERE-утилит. Конвертируйте GSM в NIST полностью онлайн через браузер.

Приватная обработка

Все GSM-загрузки удаляются после конвертации. NIST-файлы автоматически очищаются с серверов в течение 24 часов.

Как сконвертировать GSM в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

GSM 06.10 (Full Rate) — базовый речевой кодек стандарта глобальной системы мобильной связи, утверждённый ETSI в 1991 году и развёрнутый в сотнях сотовых сетей по всему миру. Работая на фиксированной скорости 13 кбит/с, алгоритм применяет регулярное импульсное возбуждение с долгосрочным предсказанием (RPE-LTP) для сжатия 20-миллисекундных кадров моно-речи при 8 кГц всего в 33 байта. Подход моделирует голосовой тракт как линейный предсказывающий фильтр, кодирует возбуждающий сигнал и использует периодичность основного тона для дальнейшего сокращения — всё настроено для передачи разборчивой речи при ограниченной полосе ранних цифровых мобильных каналов. Кодек используется не только в GSM-телефонии, но и во многих VoIP-приложениях, системах голосовой почты и IVR-платформах, извлекающих выгоду из низкого битрейта. Три конкретных преимущества выделяют его. Во-первых, выдающееся сжатие: минута речи помещается примерно в 100 КБ, обеспечивая эффективное хранение и передачу. Во-вторых, универсальный инструментарий — библиотеки libgsm и SoX выполняют кодирование и декодирование на всех основных платформах. В-третьих, свободный от роялти патентный ландшафт, способствовавший внедрению в проектах с открытым исходным кодом, таких как Asterisk и FreeSWITCH.
Дата выпуска: 1991
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Что такое NIST?

NIST — формат речевых данных от Национального института стандартов и технологий, широко используемый в исследованиях и бенчмарках речи.

Зачем конвертировать GSM в NIST?

NIST-формат ожидается многими бенчмарками распознавания речи, исследовательскими корпусами и академическими инструментами обработки телефонных данных.

Чем NIST отличается от SPH?

NIST и SPH оба относятся к семейству SPHERE. Функционально это один и тот же стандарт для речевых исследований.

Какие исследовательские инструменты читают NIST?

Kaldi, HTK, Praat и официальный инструментарий NIST SPHERE поддерживают NIST-файлы для анализа речи.

Конвертация конфиденциальна?

GSM-файлы стираются после обработки. NIST-результаты удаляются с серверов в течение 24 часов.