Конвертер AV1 в NIST

Извлекайте аудио NIST Sphere из видео AV1 онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Исследовательский стандарт

NIST Sphere — государственный стандарт для обмена речевыми данными — конвертация из AV1 создаёт аудио, готовое для исследований.

Настройки корпуса

Настройте частоту дискретизации и кодирование для точного соответствия требованиям вашего корпуса оценки или обучения речи.

Безопасная конвертация

Загруженные файлы AV1 удаляются сразу после обработки, а NIST-результаты удаляются в течение 24 часов.

Как сконвертировать AV1 в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

AV1 (AOMedia Video 1) — открытый безлицензионный формат видеокодирования, разработанный альянсом Alliance for Open Media, в число основателей которого входят Google, Mozilla, Microsoft, Amazon, Netflix, Intel и другие компании. Спецификация была утверждена в июне 2018 года с целью создания видеокодека нового поколения, превосходящего эффективность сжатия H.264 и HEVC, при этом свободного от лицензионных отчислений. AV1 обеспечивает примерно на 30-50% лучшее сжатие, чем HEVC, при эквивалентном визуальном качестве, что особенно привлекательно для стриминговых платформ, стремящихся снизить расходы на полосу пропускания без ущерба для зрителей. Кодек поддерживает широкий набор функций — синтез плёночного зерна, гибкое тайлинг для параллельной обработки, адаптивное переключение разрешения и развитый набор режимов внутри- и межкадрового предсказания. Аппаратная поддержка декодирования стремительно расширяется — мобильные процессоры, GPU и Smart TV, что снимает ранние опасения по поводу вычислительных требований при кодировании. AV1 широко внедрён крупнейшими стриминговыми сервисами для доставки 4K и HDR-контента и используется как видеокомпонент контейнера WebM для воспроизведения в браузерах. Отсутствие лицензионных отчислений делает AV1 особенно значимым для открытых веб-стандартов и доступного распространения медиа.
Разработчик: Alliance for Open Media
Дата выпуска: 25 июня 2018 г.
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать AV1 в NIST?

NIST Sphere — стандартный формат обмена данными для речевых исследований, используемый государственными и академическими программами оценки речи.

Чем открыть файлы NIST?

Инструменты речи NIST, SoX, Kaldi и HTK поддерживают аудио NIST Sphere для исследовательских и аналитических целей.

Чем NIST отличается от SPH?

NIST и SPH обозначают один и тот же формат NIST Sphere — разные расширения файлов для идентичных спецификаций аудиоконтейнера.

Какие настройки оптимальны?

Речевые исследования обычно требуют монофонического звука 8 кГц или 16 кГц, 16 бит — соответствуйте спецификациям вашего корпуса.

Мои данные конфиденциальны?

Загруженные файлы AV1 удаляются немедленно. NIST-результаты очищаются в течение 24 часов.