Конвертер AAC в SPH

Конвертируйте AAC-аудио в речевой формат NIST SPH онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Формат речевого корпуса

Создавайте NIST SPHERE файлы из AAC — стандартный контейнер для распространения данных речевых исследований.

Без установки инструментария

Конвертируйте AAC в SPH на наших серверах без установки NIST SPHERE toolkit на ваш компьютер.

Безопасность данных

Загруженные AAC-файлы удаляются после обработки. SPH-результаты стираются с серверов в течение 24 часов.

Как сконвертировать AAC в SPH

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите sph или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш sph-файл

О форматах

AAC (Advanced Audio Coding) — преемник MP3, стандартизованный ISO/IEC в рамках спецификаций MPEG-2 и позднее MPEG-4. Разработанный совместными усилиями Fraunhofer, Dolby, Sony, Nokia и AT&T, AAC обеспечивает более высокое качество звука при эквивалентном или более низком битрейте — поток AAC 96 кбит/с по воспринимаемому качеству обычно соответствует файлу MP3 на 128 кбит/с. Кодек использует модифицированное дискретное косинусное преобразование в сочетании с продвинутым психоакустическим моделированием и временным формированием шума. AAC является форматом по умолчанию в экосистеме Apple (iTunes, iPhone, iPad), YouTube и многих стриминговых сервисах. Первое преимущество — отличная эффективность сжатия: высококачественный звук при значительно меньшем объёме хранения и потреблении полосы пропускания. Второе — поддержка частот дискретизации от 8 кГц до 96 кГц и до 48 каналов, что подходит для любых задач, от голосовых вызовов до объёмного звучания. Третье — широкое внедрение компанией Apple и другими производителями гарантирует, что практически любое современное устройство, браузер и медиаплеер воспроизводит AAC без дополнительных плагинов.
Разработчик: ISO/IEC Moving Picture Experts Group
Дата выпуска: 1997
SPH — расширение файлов, хранящих аудио в формате NIST SPHERE (SPeech HEader REsources), стандарте, созданном Национальным институтом стандартов и технологий США около 1990 года. Разработанный для речевых исследований, SPH-файл содержит 1024-байтовый ASCII-заголовок с метаданными — идентификаторами базы данных, количеством каналов, частотой дискретизации, порядком байтов и типом сжатия — делая каждую запись самоописывающейся. Аудиоданные — обычно 16-битная линейная ИКМ при 16 кГц, хотя допустимы другие конфигурации. Исследователи в NIST, DARPA и университетах по всему миру используют SPH для распространения речевых корпусов — TIMIT, Switchboard и коллекций LDC, лежащих в основе современных систем автоматического распознавания речи. Ключевое преимущество — человекочитаемый заголовок, позволяющий скриптам разбирать метаданные записи без бинарного декодирования. Строгая стандартизация формата также исключает неоднозначности при обмене данными между учреждениями и платформами. Поскольку SPH-файлы хранят несжатый PCM, они сохраняют полную точность аудио — критически важное свойство при обучении акустических моделей, где даже малые артефакты могут исказить результаты.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать AAC в SPH?

SPH (SPHERE) — стандартный формат для речевых корпусов NIST. Необходим для лингвистических исследований и разработки речевых технологий.

Чем обработать SPH?

NIST SPHERE toolkit, HTK, Kaldi и SoX читают и обрабатывают аудиофайлы в формате SPH.

SPH используется за пределами исследований?

Редко — SPH преимущественно академический и государственный формат для распространения размеченных речевых данных.

Какие типичные спецификации SPH?

SPH-файлы обычно содержат 8–16 кГц моно-аудио с текстовыми заголовками, описывающими условия записи и метаданные диктора.

Можно ли конвертировать оптом?

Загрузите несколько AAC-файлов и конвертируйте их в SPH за раз — полезно для подготовки исследовательских речевых датасетов.