Конвертер MOV в NIST

Извлеките аудио из MOV в формат NIST SPHERE онлайн

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

QuickTime в речевые данные

Извлеките диалог из MOV-видео и упакуйте как NIST SPHERE — эталонный формат для распространения речевых корпусов и обучения ASR.

Любая платформа

Конвертируйте MOV в NIST с любого устройства с браузером. ПО Apple или инструментарий SPHERE не нужны — просто загрузите и скачайте.

Безопасность данных

MOV-загрузки удаляются после обработки. NIST-вывод стирается в течение 24 часов — исследовательские речевые материалы остаются конфиденциальными.

Как сконвертировать MOV в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

MOV — мультимедийный контейнерный формат, разработанный компанией Apple Inc. и представленный в декабре 1991 года с запуском мультимедийной платформы QuickTime. Как нативный формат QuickTime, MOV стал пионером многих концепций, впоследствии повлиявших на ISO base media file format (MPEG-4 Part 12) и его производные, включая MP4. Контейнер использует иерархическую структуру атомов (или блоков), где каждый атом хранит определённый тип данных — видео- и аудиодорожки, метаданные, текст и информацию о таймкоде. MOV поддерживает чрезвычайно широкий спектр кодеков — H.264, HEVC, ProRes, Apple Intermediate Codec, AAC, PCM и многие другие. Такая гибкость кодеков в сочетании с поддержкой множественных дорожек, ссылочных фильмов и списков редактирования сделала MOV основой профессионального видеопроизводства. Кодек ProRes от Apple, обычно упакованный в контейнер MOV, — отраслевой стандарт для постпродакшна и финальной обработки для эфира. Формат одинаково успешно работает как со сжатым контентом для доставки, так и с высокобитрейтным производственным материалом. Точная обработка таймкода и метаданных делает MOV особенно ценным в процессах, требующих покадрового монтажа и надёжного обмена между производственными инструментами. MOV нативно поддерживается на всех платформах Apple и широко распознаётся профессиональным программным обеспечением для монтажа на всех операционных системах, сохраняя актуальность на протяжении десятилетий развития видеотехнологий.
Разработчик: Apple Inc.
Дата выпуска: 2 декабря 1991 г.
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать MOV в NIST?

NIST SPHERE — эталон для аудио речевых исследований. Извлечение диалогов MOV в NIST создаёт правильно отформатированные данные для обучения ASR.

Какие фреймворки поддерживают NIST?

Kaldi, HTK, инструментарий NIST SPHERE и большинство академических ASR-платформ напрямую работают с файлами речевого аудио в формате NIST.

MOV — хороший источник речи?

MOV с устройств Apple часто имеет чистый захват аудио. Это делает QuickTime-записи хорошим исходным материалом для наборов данных речевых исследований.

NIST сжимает аудио?

Нет — NIST хранит PCM без lossy-сжатия. MOV-аудио достигает формата SPHERE в полном качестве для точного речевого анализа.

Чем NIST отличается от SPH?

NIST и SPH — один и тот же формат: SPHERE Национального института стандартов и технологий. Расширения взаимозаменяемы.