Bộ chuyển đổi MPEG sang SPH
Trích xuất âm thanh MPEG dạng NIST SPHERE giọng nói trực tuyến
Video sang corpus giọng nói
Trích xuất hội thoại từ video MPEG và đóng gói dạng NIST SPHERE — bỏ qua trích xuất thủ công khi xây dựng bộ dữ liệu nghiên cứu giọng nói.
Chuẩn NIST
Đầu ra SPH đáp ứng chính xác đặc tả NIST SPHERE. Nhập trực tiếp vào Kaldi, HTK hoặc bất kỳ framework nhận dạng giọng nói nào.
Xử lý an toàn
Tệp MPEG tải lên được gỡ sau khi chuyển đổi. Tệp đầu ra SPH được xóa trong vòng 24 giờ — tài liệu nghiên cứu được bảo mật.
Làm thế nào để chuyển đổi MPEG sang SPH
Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.
Chọn sph hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)
Hãy để tập tin chuyển đổi và bạn có thể tải tập tin sph của bạn xuống ngay sau đó
Về các định dạng
Các câu hỏi thường gặp
SPH là chuẩn NIST SPHERE cho nghiên cứu giọng nói. Hội thoại video MPEG trở thành dữ liệu được định dạng đúng cho huấn luyện và đánh giá ASR.
Kaldi, HTK, Praat và NIST SPHERE toolkit hỗ trợ SPH nguyên bản. Đây là định dạng trao đổi chuẩn cho nghiên cứu âm thanh giọng nói.
Không — SPH lưu trữ dữ liệu PCM mà không nén lossy. Âm thanh MPEG đến định dạng SPHERE ở chất lượng đầy đủ cho xử lý giọng nói chính xác.
Âm thanh MPEG-1 cung cấp chất lượng đủ cho nghiên cứu giọng nói. Nội dung hội thoại được bảo toàn tốt qua quá trình trích xuất và mã hóa SPH.
Tải lên nhiều video MPEG và chuyển đổi hàng loạt sang SPH. Hiệu quả cho xây dựng corpus giọng nói từ bộ sưu tập video MPEG lưu trữ.