Конвертер MXF в NIST

Извлеките NIST-аудио из профессиональных MXF-материалов

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Соответствие стандартам

NIST SPHERE соответствует стандартам государственных речевых исследований. Извлеките вещательное MXF-аудио для официальных оценочных кампаний.

Исследования речи

NIST из MXF напрямую поступает в пайплайны распознавания речи и инструменты лингвистического анализа.

Онлайн-обработка

Извлечение NIST из MXF выполняется в облаке — исследовательское ПО устанавливать локально не нужно.

Как сконвертировать MXF в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

MXF (Material Exchange Format) — профессиональный медиаконтейнер, стандартизированный Обществом инженеров кино и телевидения (SMPTE) в 2004 году по спецификации SMPTE 377M. Разработанный для индустрии вещания и постпродакшна, MXF обеспечивает вендоронезависимую оболочку для переноса видео, аудио и развитых описательных метаданных между различными производственными системами и платформами. Формат поддерживает широкий спектр профессиональных кодеков — MPEG-2, AVC-Intra, DNxHD, DNxHR, ProRes и JPEG 2000, адаптируясь к различным уровням качества: от прокси-монтажа до архива мастер-качества. Развитая система метаданных — одна из определяющих характеристик MXF: она несёт производственную информацию — таймкоды, названия клипов, описательные маркеры, ссылки на источники и технические параметры — в структурированной схеме кодирования Key-Length-Value (KLV). Эти метаданные сопровождают контент через всю производственную цепочку, снижая риск потери информации при перемещении файлов между системами ввода, монтажа, графики, выдачи в эфир и архивирования. Файлы MXF используют систему операционных шаблонов, определяющих различные уровни сложности — от простых однообъектных пакетов (OP1a) до сложных многообъектных плейлистов. Все ведущие производители вещательного оборудования и файловых систем документооборота поддерживают MXF, и он служит форматом обмена для стандартов AS-02 и AS-11 в телевещании.
Дата выпуска: 2004
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать MXF в NIST?

NIST — формат государственных речевых исследований. Извлеките вещательное аудио из MXF для стандартизированного лингвистического анализа.

NIST и SPH — одно и то же?

NIST и SPH — оба относятся к формату SPHERE от Национального института стандартов и технологий США — это фактически один и тот же формат.

Какие инструменты читают NIST?

SOX, Kaldi, HTK Toolkit и инструменты оценки речи NIST поддерживают формат NIST SPHERE нативно.

Какие частоты дискретизации используются?

Речевые данные NIST обычно используют 8 или 16 кГц в зависимости от условий записи и требований исследования.

Можно ли обработать несколько файлов?

Загрузите несколько MXF-файлов и извлеките NIST-аудио из каждого параллельно для создания наборов речевых данных.