Chuyển đổi MP3 sang SPH
Tạo âm thanh NIST Sphere SPH từ bản ghi MP3
Chuẩn corpus
SPH là định dạng đằng sau các corpus giọng nói lớn như TIMIT và Switchboard — chuyển đổi dữ liệu MP3 để dùng trong nghiên cứu ASR.
Header metadata phong phú
File SPH mang metadata chi tiết về người nói, kênh và điều kiện ghi âm — cần thiết cho tổ chức nghiên cứu giọng nói.
Chuyển đổi hàng loạt
Xử lý toàn bộ bộ sưu tập bản ghi MP3 sang SPH đồng thời — xây dựng corpus giọng nói hiệu quả.
Làm thế nào để chuyển đổi MP3 sang SPH
Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.
Chọn sph hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)
Hãy để tập tin chuyển đổi và bạn có thể tải tập tin sph của bạn xuống ngay sau đó
Về các định dạng
Các câu hỏi thường gặp
SPH là định dạng Sphere được NIST dùng cho nghiên cứu giọng nói. Các bản phát hành của Linguistic Data Consortium và tập dữ liệu huấn luyện ASR thường dùng SPH.
Kaldi, HTK, Praat, SoX và hầu hết framework nhận dạng giọng nói xử lý file SPH. Đây là chuẩn thực tế cho corpus giọng nói.
SPH và NIST đề cập đến cùng định dạng Sphere — SPH là phần mở rộng file phổ biến cho các file NIST SPeech HEader Resources.
Header Sphere bao gồm thông tin người nói, điều kiện ghi âm, chi tiết kênh và metadata quản lý corpus khác.
Tải lên một lô bản ghi MP3 và chuyển đổi tất cả sang SPH trong một phiên — hiệu quả khi lắp ráp tập dữ liệu nghiên cứu giọng nói.