Конвертер WEBM в NIST

Создавайте аудио NIST SPHERE из WEBM-видео онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Исследовательский эталон

NIST SPHERE — способ распространения речевого аудио в исследованиях. Веб-контент WEBM превращается в правильно форматированные данные для разработки ASR.

В браузере

SPHERE-тулкит или WEBM-декодеры локально не нужны. Конвертируйте полностью в браузере на любом устройстве или операционной системе.

Безопасность данных

WEBM-загрузки удаляются после конвертации. NIST-результат удаляется в течение 24 часов — ваши речевые исследовательские данные конфиденциальны.

Как сконвертировать WEBM в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

WebM — открытый безлицензионный мультимедийный контейнерный формат, разработанный компанией Google и представленный на конференции Google I/O в мае 2010 года. Формат объединяет контейнер Matroska (подмножество MKV) с видеокодеками VP8 или VP9 и аудиокодеками Vorbis или Opus, создавая полностью открытый медиастек, предназначенный специально для веба. Google выпустила WebM вместе с кодеком VP8 под разрешительной лицензией BSD, устранив патентные и лицензионные барьеры, препятствовавшие использованию H.264 для открытого веб-видео. Контейнер WebM наследует эффективную бинарную структуру Matroska, ограничивая её профилями, оптимизированными для веба, что обеспечивает быстрый парсинг и легковесную реализацию в браузерах. WebM с VP9 достигает эффективности сжатия, конкурентной с H.264 High Profile и приближающейся к HEVC, что делает его пригодным для доставки высококачественного видео при сниженной полосе пропускания. Все основные веб-браузеры — Chrome, Firefox, Edge и Opera — поддерживают воспроизведение WebM нативно, а YouTube использует VP9 в WebM как один из основных форматов доставки. Формат поддерживает прозрачность альфа-канала в видео, что ценно для композитинга веб-графики и наложений. Совсем недавно WebM был расширен для поддержки видео AV1, продолжая эволюцию как средство внедрения открытых кодеков. Сочетание конкурентного сжатия, нулевых лицензионных расходов и универсальной браузерной поддержки делает WebM краеугольным камнем безлицензионной веб-мультимедийной доставки.
Разработчик: Google
Дата выпуска: 19 мая 2010 г.
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать WEBM в NIST?

NIST SPHERE — эталонный формат для распространения речевых данных. Лекции и доклады в WEBM становятся структурированным аудио для ASR-исследований.

NIST то же самое, что SPH?

Да — оба обозначают формат SPHERE от Национального института стандартов и технологий США. Расширения взаимозаменяемы.

WEBM обеспечивает качественное аудио?

WEBM использует современные кодеки Opus или Vorbis — эффективные и высококачественные. Аудио, извлечённое для NIST, хорошо сохраняет чёткость речи.

Какие ASR-инструменты принимают NIST?

Kaldi, HTK, оценочные фреймворки NIST и большинство академических лабораторий распознавания речи работают с NIST SPHERE как стандартным форматом.

Можно ли пакетно конвертировать WEBM-файлы?

Загружайте несколько WEBM-видео и конвертируйте их все в NIST за раз. Эффективно для создания больших речевых корпусов из архивов веб-видео.