Bộ chuyển đổi F4V sang SPH

Trích xuất âm thanh NIST SPHERE SPH từ video Flash F4V

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Tiêu chuẩn nghiên cứu giọng nói

SPHERE là tiêu chuẩn cho kho ngữ liệu giọng nói — trích xuất âm thanh sẵn sàng nghiên cứu từ F4V cho phân tích ngôn ngữ và giọng nói.

Siêu dữ liệu phong phú

Tệp SPH mang siêu dữ liệu header chi tiết kèm âm thanh — thiết yếu cho quy trình nghiên cứu giọng nói khoa học.

Quyền riêng tư dữ liệu

Tệp F4V tải lên bị xóa sau trích xuất. Tệp SPH bị xóa khỏi máy chủ trong vòng 24 giờ.

Làm thế nào để chuyển đổi F4V sang SPH

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn sph hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin sph của bạn xuống ngay sau đó

Về các định dạng

F4V là định dạng bộ chứa đa phương tiện được phát triển bởi Adobe Systems như một bước tiến hóa của hệ sinh thái Flash Video. Ra mắt vào tháng 12 năm 2007 cùng Flash Player 9 Update 3, F4V dựa trên định dạng tệp phương tiện cơ sở ISO (MPEG-4 Part 14) và được tạo ra để hỗ trợ codec video H.264 và âm thanh AAC trong nền tảng Adobe Flash. Khác với tiền nhiệm FLV sử dụng cấu trúc bộ chứa độc quyền, F4V áp dụng kiến trúc atom/box chuẩn hóa tương thích MP4, tăng khả năng tương tác với các công cụ và quy trình làm việc phương tiện khác. Định dạng hỗ trợ các tính năng nâng cao bao gồm mã hóa H.264 high-profile, âm thanh AAC đa kênh và văn bản đồng bộ thời gian cho phụ đề. F4V đại diện cho một bước đi chiến lược nhằm đáp ứng nhu cầu ngày càng tăng đối với nội dung H.264 trên web, vì bộ chứa FLV cũ không thể đóng gói hiệu quả codec mới này. Trong thời kỳ đỉnh cao, F4V cung cấp phần lớn nội dung video chất lượng cao được phân phối qua các nền tảng truyền phát và trình phát video dựa trên Flash trên web. Bộ chứa hỗ trợ cả tải xuống liên tục và truyền phát động, mang đến cho các nhà xuất bản nội dung nhiều tùy chọn phân phối linh hoạt. Mặc dù sự suy giảm của Flash Player nhường chỗ cho video HTML5 đã giảm việc tạo nội dung F4V mới, cấu trúc dựa trên MP4 đồng nghĩa với việc các luồng phương tiện bên trong vẫn dễ dàng truy cập thông qua các công cụ hiện đại.
Nhà phát triển: Adobe Systems
Phát hành lần đầu: Ngày 03 tháng 12 năm 2007
SPH là phần mở rộng tệp cho âm thanh lưu trữ trong định dạng NIST SPHERE (SPeech HEader REsources), một tiêu chuẩn do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ tạo ra khoảng năm 1990. Được xây dựng cho nghiên cứu giọng nói, tệp SPH mang header ASCII 1024 byte chứa đầy siêu dữ liệu — mã định danh cơ sở dữ liệu, số kênh, tần số lấy mẫu, thứ tự byte và kiểu nén — giúp mỗi bản ghi tự mô tả. Âm thanh bên dưới thường là PCM tuyến tính 16-bit lấy mẫu ở 16 kHz, dù các cấu hình khác cũng được phép. Các nhà nghiên cứu tại NIST, DARPA và các trường đại học trên toàn thế giới dựa vào SPH để phân phối kho ngữ liệu giọng nói như TIMIT, Switchboard và các bộ sưu tập LDC — nền tảng của các hệ thống nhận dạng giọng nói tự động hiện đại. Ưu điểm chính là header đọc được bằng mắt người cho phép các script phân tích siêu dữ liệu bản ghi mà không cần giải mã nhị phân. Sự chuẩn hóa nghiêm ngặt của định dạng cũng loại bỏ sự mơ hồ khi chia sẻ tập dữ liệu giữa các tổ chức và nền tảng. Vì tệp SPH lưu trữ PCM không nén, chúng bảo toàn toàn bộ chất lượng âm thanh — điều cực kỳ quan trọng khi huấn luyện mô hình âm học mà ngay cả những artifact nhỏ cũng có thể làm lệch kết quả.
Phát hành lần đầu: 1990

Các câu hỏi thường gặp

Tại sao nên chuyển F4V sang SPH?

SPH (SPHERE) là định dạng tiêu chuẩn cho kho ngữ liệu nghiên cứu giọng nói tại NIST và LDC. Trích xuất từ F4V cung cấp âm thanh tương thích nghiên cứu.

Phần mềm nào dùng tệp SPH?

Đánh giá NIST, Linguistic Data Consortium, HTK và công cụ nhận dạng giọng nói Kaldi đều hoạt động với định dạng SPHERE.

SPH có phải định dạng nghiên cứu không?

Có — SPHERE được tạo đặc biệt để phân phối dữ liệu nghiên cứu giọng nói với siêu dữ liệu header phong phú.

SPH có bao gồm siêu dữ liệu không?

Tệp SPH mang header văn bản phong phú với tần số lấy mẫu, kênh, mã hóa và siêu dữ liệu kho ngữ liệu cho nghiên cứu.

Có thể chuyển đổi nhiều tệp không?

Tải nhiều video F4V lên và trích xuất âm thanh SPH từ mỗi tệp đồng thời.