Bộ chuyển đổi F4V sang SPH
Trích xuất âm thanh NIST SPHERE SPH từ video Flash F4V
Tiêu chuẩn nghiên cứu giọng nói
SPHERE là tiêu chuẩn cho kho ngữ liệu giọng nói — trích xuất âm thanh sẵn sàng nghiên cứu từ F4V cho phân tích ngôn ngữ và giọng nói.
Siêu dữ liệu phong phú
Tệp SPH mang siêu dữ liệu header chi tiết kèm âm thanh — thiết yếu cho quy trình nghiên cứu giọng nói khoa học.
Quyền riêng tư dữ liệu
Tệp F4V tải lên bị xóa sau trích xuất. Tệp SPH bị xóa khỏi máy chủ trong vòng 24 giờ.
Làm thế nào để chuyển đổi F4V sang SPH
Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.
Chọn sph hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)
Hãy để tập tin chuyển đổi và bạn có thể tải tập tin sph của bạn xuống ngay sau đó
Về các định dạng
Các câu hỏi thường gặp
SPH (SPHERE) là định dạng tiêu chuẩn cho kho ngữ liệu nghiên cứu giọng nói tại NIST và LDC. Trích xuất từ F4V cung cấp âm thanh tương thích nghiên cứu.
Đánh giá NIST, Linguistic Data Consortium, HTK và công cụ nhận dạng giọng nói Kaldi đều hoạt động với định dạng SPHERE.
Có — SPHERE được tạo đặc biệt để phân phối dữ liệu nghiên cứu giọng nói với siêu dữ liệu header phong phú.
Tệp SPH mang header văn bản phong phú với tần số lấy mẫu, kênh, mã hóa và siêu dữ liệu kho ngữ liệu cho nghiên cứu.
Tải nhiều video F4V lên và trích xuất âm thanh SPH từ mỗi tệp đồng thời.