Bộ chuyển đổi F4V sang NIST

Trích xuất âm thanh NIST SPHERE từ video Flash F4V

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Tiêu chuẩn nghiên cứu

NIST SPHERE thiết yếu cho đánh giá giọng nói — trích xuất âm thanh định dạng nghiên cứu từ video Flash F4V.

Xử lý trên đám mây

Không cần công cụ nghiên cứu cục bộ để chuyển đổi. Trích xuất âm thanh NIST từ F4V hoàn toàn qua máy chủ.

Xử lý an toàn

Tệp F4V tải lên bị xóa sau trích xuất. Tệp NIST đầu ra bị xóa khỏi máy chủ trong vòng 24 giờ.

Làm thế nào để chuyển đổi F4V sang NIST

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn nist hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin nist của bạn xuống ngay sau đó

Về các định dạng

F4V là định dạng bộ chứa đa phương tiện được phát triển bởi Adobe Systems như một bước tiến hóa của hệ sinh thái Flash Video. Ra mắt vào tháng 12 năm 2007 cùng Flash Player 9 Update 3, F4V dựa trên định dạng tệp phương tiện cơ sở ISO (MPEG-4 Part 14) và được tạo ra để hỗ trợ codec video H.264 và âm thanh AAC trong nền tảng Adobe Flash. Khác với tiền nhiệm FLV sử dụng cấu trúc bộ chứa độc quyền, F4V áp dụng kiến trúc atom/box chuẩn hóa tương thích MP4, tăng khả năng tương tác với các công cụ và quy trình làm việc phương tiện khác. Định dạng hỗ trợ các tính năng nâng cao bao gồm mã hóa H.264 high-profile, âm thanh AAC đa kênh và văn bản đồng bộ thời gian cho phụ đề. F4V đại diện cho một bước đi chiến lược nhằm đáp ứng nhu cầu ngày càng tăng đối với nội dung H.264 trên web, vì bộ chứa FLV cũ không thể đóng gói hiệu quả codec mới này. Trong thời kỳ đỉnh cao, F4V cung cấp phần lớn nội dung video chất lượng cao được phân phối qua các nền tảng truyền phát và trình phát video dựa trên Flash trên web. Bộ chứa hỗ trợ cả tải xuống liên tục và truyền phát động, mang đến cho các nhà xuất bản nội dung nhiều tùy chọn phân phối linh hoạt. Mặc dù sự suy giảm của Flash Player nhường chỗ cho video HTML5 đã giảm việc tạo nội dung F4V mới, cấu trúc dựa trên MP4 đồng nghĩa với việc các luồng phương tiện bên trong vẫn dễ dàng truy cập thông qua các công cụ hiện đại.
Nhà phát triển: Adobe Systems
Phát hành lần đầu: Ngày 03 tháng 12 năm 2007
NIST SPHERE (SPeech HEader REsources) là định dạng tệp âm thanh chuyên dụng do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ phát triển, phục vụ nghiên cứu giọng nói, đặc biệt các dự án được DARPA tài trợ. Định dạng này đóng gói các mẫu âm thanh thô kèm theo phần header ASCII có cấu trúc, chứa siêu dữ liệu như tần số lấy mẫu, số kênh, kiểu mã hóa, thông tin nhân khẩu học người nói và chú thích phiên âm — lý tưởng cho việc phân phối kho dữ liệu giọng nói. Các tệp NIST thường lưu trữ âm thanh PCM không nén hoặc mu-law ở tần số lấy mẫu chất lượng điện thoại (8 kHz hoặc 16 kHz), dù bộ chứa đủ linh hoạt để hỗ trợ nhiều kiểu mã hóa khác. Ưu điểm nổi bật là phần header tự mô tả phong phú, cho phép nhà nghiên cứu nhúng trực tiếp siêu dữ liệu chi tiết của kho ngữ liệu vào tệp mà không cần tệp đi kèm. SPHERE cũng trở thành tiêu chuẩn thực tế cho các cơ sở dữ liệu giọng nói lớn như TIMIT, Switchboard và Fisher corpus, được công nhận rộng rãi trong các phòng thí nghiệm học thuật và chính phủ. Đặc tả mở và sự sẵn có của các công cụ dòng lệnh (sphere, h_strip, w_decode) giúp việc chuyển đổi, kiểm tra và xử lý các tệp này trở nên đơn giản trong các quy trình xử lý giọng nói.
Phát hành lần đầu: 1990

Các câu hỏi thường gặp

Tại sao nên chuyển F4V sang NIST?

Định dạng NIST SPHERE cần cho chuẩn đánh giá giọng nói và phân phối dữ liệu nghiên cứu trong ngôn ngữ học tính toán.

Phần mềm nào dùng NIST?

Công cụ đánh giá giọng nói NIST, Kaldi, HTK và ứng dụng nghiên cứu ngôn ngữ sử dụng tệp âm thanh định dạng NIST.

NIST có giống SPH không?

NIST và SPH đều chỉ định dạng SPHERE được phát triển tại Viện Tiêu chuẩn và Công nghệ Quốc gia.

NIST dùng mã hóa gì?

NIST SPHERE hỗ trợ PCM, mu-law và các mã hóa khác với header văn bản phong phú chứa siêu dữ liệu.

Có thể trích xuất hàng loạt không?

Tải nhiều tệp F4V lên và trích xuất âm thanh NIST từ mỗi tệp đồng thời.