Конвертер GSM в SPH

Оформите GSM-аудио как речевые данные NIST SPH онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Лингвистический стандарт

Конвертируйте GSM-записи в SPH — формат NIST SPHERE, используемый в крупных речевых корпусах и академических исследовательских базах.

GSM в речевые исследования

Свяжите мобильную телефонию и академическую обработку речи, кодируя GSM-записи в исследовательский формат SPHERE.

Приватность данных

Все GSM-загрузки стираются после обработки. SPH-результаты удаляются с серверов в течение 24 часов.

Как сконвертировать GSM в SPH

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите sph или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш sph-файл

О форматах

GSM 06.10 (Full Rate) — базовый речевой кодек стандарта глобальной системы мобильной связи, утверждённый ETSI в 1991 году и развёрнутый в сотнях сотовых сетей по всему миру. Работая на фиксированной скорости 13 кбит/с, алгоритм применяет регулярное импульсное возбуждение с долгосрочным предсказанием (RPE-LTP) для сжатия 20-миллисекундных кадров моно-речи при 8 кГц всего в 33 байта. Подход моделирует голосовой тракт как линейный предсказывающий фильтр, кодирует возбуждающий сигнал и использует периодичность основного тона для дальнейшего сокращения — всё настроено для передачи разборчивой речи при ограниченной полосе ранних цифровых мобильных каналов. Кодек используется не только в GSM-телефонии, но и во многих VoIP-приложениях, системах голосовой почты и IVR-платформах, извлекающих выгоду из низкого битрейта. Три конкретных преимущества выделяют его. Во-первых, выдающееся сжатие: минута речи помещается примерно в 100 КБ, обеспечивая эффективное хранение и передачу. Во-вторых, универсальный инструментарий — библиотеки libgsm и SoX выполняют кодирование и декодирование на всех основных платформах. В-третьих, свободный от роялти патентный ландшафт, способствовавший внедрению в проектах с открытым исходным кодом, таких как Asterisk и FreeSWITCH.
Дата выпуска: 1991
SPH — расширение файлов, хранящих аудио в формате NIST SPHERE (SPeech HEader REsources), стандарте, созданном Национальным институтом стандартов и технологий США около 1990 года. Разработанный для речевых исследований, SPH-файл содержит 1024-байтовый ASCII-заголовок с метаданными — идентификаторами базы данных, количеством каналов, частотой дискретизации, порядком байтов и типом сжатия — делая каждую запись самоописывающейся. Аудиоданные — обычно 16-битная линейная ИКМ при 16 кГц, хотя допустимы другие конфигурации. Исследователи в NIST, DARPA и университетах по всему миру используют SPH для распространения речевых корпусов — TIMIT, Switchboard и коллекций LDC, лежащих в основе современных систем автоматического распознавания речи. Ключевое преимущество — человекочитаемый заголовок, позволяющий скриптам разбирать метаданные записи без бинарного декодирования. Строгая стандартизация формата также исключает неоднозначности при обмене данными между учреждениями и платформами. Поскольку SPH-файлы хранят несжатый PCM, они сохраняют полную точность аудио — критически важное свойство при обучении акустических моделей, где даже малые артефакты могут исказить результаты.
Дата выпуска: 1990

Часто задаваемые вопросы

Что такое SPH?

SPH — формат NIST SPHERE (SPeech HEader Resources), стандартный тип файлов для исследовательских речевых баз и лингвистических корпусов.

Зачем конвертировать GSM в SPH?

SPH необходим многим исследовательским инструментам и лингвистическим базам. Конвертация GSM подготавливает телефонные данные для академического анализа.

Какие инструменты работают с SPH?

Инструментарий NIST SPHERE, Kaldi, HTK, Praat и другие средства речевых исследований нативно читают и обрабатывают SPH-файлы.

SPH — то же самое, что NIST?

Да. SPH и NIST обозначают один и тот же формат SPHERE, разработанный Национальным институтом стандартов и технологий для речевых данных.

Мои файлы обрабатываются приватно?

GSM-загрузки удаляются после конвертации. SPH-результаты стираются с серверов в течение 24 часов.