Конвертер CDDA в NIST

Преобразуйте CD-аудио в формат NIST Sphere онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Академический стандарт

Конвертируйте CDDA в NIST Sphere — формат, используемый исследователями речи по всему миру для обмена и распространения аудиодатасетов.

Богатые метаданные

NIST Sphere включает текстовый заголовок для метаданных — частота дискретизации, каналы, кодирование и пользовательские аннотации для исследований.

Веб-инструмент

Не нужны Kaldi, HTK или утилиты NIST. Конвертируйте CDDA в NIST прямо в браузере с любой платформы.

Как сконвертировать CDDA в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

CDDA (Compact Disc Digital Audio), известный как стандарт Red Book, определяет аудио, хранимое на музыкальных компакт-дисках. Совместно разработанный Sony и Philips и опубликованный в 1980 году, он задал параметры, определившие цифровое аудио на десятилетия: 16-битная линейная ИКМ при 44,1 кГц в стерео, что даёт 1411,2 кбит/с без сжатия. Каждый диск вмещает до 80 минут, организованных в треки с индексными точками, субканальными данными для отображения текста и кодами коррекции ошибок (CIRC), обеспечивающими надёжное воспроизведение даже при незначительных царапинах. При извлечении аудио с CD полученный поток часто сохраняется с расширением .cdda как сырые PCM-данные перед конвертацией. Очевидное преимущество — несжатая, без потерь природа формата: то, что воспроизводится, математически идентично студийному мастеру при заданном разрешении. Надёжная коррекция ошибок обеспечивает отличную устойчивость, сохраняя целостность аудио даже при умеренном износе поверхности диска. Будучи проданным миллиардами экземпляров с момента первого коммерческого выпуска в 1982 году, CDDA установил базовые ожидания качества цифровой музыки и по сей день остаётся эталоном для оценки сжатых кодеков.
Разработчик: Sony / Philips
Дата выпуска: Октябрь 1980
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать CDDA в NIST?

NIST Sphere — де-факто формат для речевых корпусов в академических исследованиях. Конвертация CDDA делает аудио пригодным для пайплайнов обработки речи.

NIST и SPH — это одно и то же?

Да — NIST и SPH оба обозначают формат NIST Sphere. Файл может использовать расширение .nist или .sph в зависимости от принятого соглашения.

Какие инструменты поддерживают NIST?

SoX, Kaldi, HTK и собственные утилиты NIST Sphere. Большинство академических фреймворков обработки речи включают нативную поддержку.

Может ли NIST хранить CD-качество?

Формат это поддерживает, хотя речевые исследования обычно используют пониженные частоты. NIST обрабатывает 44,1 кГц для полной точности CDDA.

Можно ли конвертировать массово?

Загрузите несколько CDDA-треков и пакетно сконвертируйте в NIST — формируйте исследовательские датасеты из CD-записей эффективно.