Конвертер F4V в NIST

Извлекайте речевые данные в формате NIST SPHERE из Flash-видео F4V

Перетащите файлы сюда. 1 GB максимальный размер файла или Регистрация
в
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Стандарт речевых исследований

NIST SPHERE — признанный формат академических речевых корпусов: конвертация из F4V открывает речевой материал для оценочных задач.

Серверная обработка

Конвертация выполняется на наших серверах — ваше устройство остаётся свободным, пока F4V обрабатывается в NIST SPHERE удалённо.

Безопасная обработка файлов

Загруженные F4V-файлы удаляются сразу после конвертации. NIST SPHERE-результаты автоматически очищаются с серверов в течение 24 часов.

Как сконвертировать F4V в NIST

1

Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу.

2

Выберите nist или любой другой формат, который вам нужен (более 200 поддерживаемых форматов)

3

Позвольте файлу сконвертироваться и вы сразу сможете скачать ваш nist-файл

О форматах

F4V — мультимедийный контейнерный формат, разработанный компанией Adobe Systems как развитие экосистемы Flash Video. Представленный в декабре 2007 года вместе с Flash Player 9 Update 3, F4V основан на ISO base media file format (MPEG-4 Part 14) и создан для поддержки видеокодека H.264 и аудио AAC в рамках платформы Adobe Flash. В отличие от предшественника FLV с проприетарной структурой контейнера, F4V использует стандартизированную архитектуру атомов/блоков, совместимую с MP4, что повышает совместимость с другими медиаинструментами и рабочими процессами. Формат поддерживает продвинутые функции — кодирование H.264 High Profile, многоканальный звук AAC и текст с привязкой ко времени для субтитров. F4V стал стратегическим шагом для удовлетворения растущего спроса на H.264-контент в вебе, поскольку старый контейнер FLV не мог эффективно упаковать этот кодек. В пиковые годы F4V обеспечивал значительную часть высококачественного видеоконтента, доставляемого через Flash-платформы и видеоплееры в интернете. Контейнер поддерживает как прогрессивную загрузку, так и динамическую потоковую доставку, предоставляя издателям контента гибкие варианты распространения. Хотя упадок Flash Player в пользу HTML5-видео сократил создание нового контента F4V, структура на основе MP4 означает, что содержащиеся медиапотоки легко доступны через современные инструменты.
Разработчик: Adobe Systems
Дата выпуска: 3 декабря 2007 г.
NIST SPHERE (SPeech HEader REsources) — специализированный аудиоформат, созданный Национальным институтом стандартов и технологий для исследований речи, в особенности проектов, финансируемых DARPA. Формат оборачивает сырые аудиосэмплы структурированным ASCII-заголовком, содержащим метаданные: частоту дискретизации, количество каналов, тип кодирования, демографические данные дикторов и аннотации транскрипций — что делает его идеальным для распространения речевых корпусов. Файлы NIST обычно хранят несжатое PCM или mu-law аудио при телефонных частотах дискретизации (8 кГц или 16 кГц), хотя контейнер достаточно гибок для различных кодировок. Ключевое преимущество — богатый самодокументирующийся заголовок, позволяющий исследователям встраивать подробные метаданные корпуса прямо в файл, исключая сопутствующие файлы. SPHERE также стал де-факто стандартом для крупных баз речевых данных — TIMIT, Switchboard и корпуса Fisher, — обеспечивая широкое признание в академических и государственных лабораториях. Открытая спецификация и доступность утилит командной строки (sphere, h_strip, w_decode) делают конвертацию, инспекцию и обработку этих файлов в конвейерах речевой обработки простой задачей.
Дата выпуска: 1990

Часто задаваемые вопросы

Зачем конвертировать F4V в NIST?

NIST SPHERE — стандарт для наборов данных распознавания речи NIST. Извлечение аудио из F4V позволяет использовать речь в исследовательских задачах.

Чем открыть NIST SPHERE-файлы?

NIST SPHERE поддерживают Kaldi, HTK и инструменты оценки речи NIST — стандартный стек для исследований автоматического распознавания речи.

NIST SPHERE подходит для обучения моделей?

Да — NIST SPHERE широко используется в академических речевых корпусах, что делает его удобным форматом для систем Kaldi и HTK.

Сохраняется ли качество речи при конвертации?

При высокой частоте дискретизации извлечённый NIST SPHERE сохраняет разборчивость речи из оригинального F4V-видео.

Можно обработать несколько файлов?

Да — загрузите несколько F4V-видео и конвертируйте в NIST SPHERE пакетом для формирования речевого датасета.