Bộ chuyển đổi OGG sang SPH
Tạo audio nghiên cứu giọng nói SPHERE từ OGG
Chuẩn bộ dữ liệu giọng nói
SPH là định dạng đứng sau các bộ dữ liệu giọng nói lớn — chuyển bản ghi OGG thành audio nghiên cứu được định dạng đúng.
Chuẩn bị dữ liệu
Xử lý toàn bộ bộ sưu tập giọng nói OGG sang SPH đồng thời — chuẩn bị bộ dữ liệu nghiên cứu trong một thao tác.
Chuyển đổi trực tuyến
Không cần cài công cụ xử lý giọng nói — tạo tệp SPH từ OGG trực tiếp trên trình duyệt.
Làm thế nào để chuyển đổi OGG sang SPH
Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.
Chọn sph hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)
Hãy để tập tin chuyển đổi và bạn có thể tải tập tin sph của bạn xuống ngay sau đó
Về các định dạng
Các câu hỏi thường gặp
SPH (SPHERE) là định dạng NIST cho bộ dữ liệu nghiên cứu giọng nói. Hệ thống huấn luyện ASR và công cụ ngôn ngữ học yêu cầu đầu vào định dạng SPHERE.
Kaldi, HTK, công cụ đánh giá NIST và bộ dữ liệu giọng nói học thuật như TIMIT và Switchboard dùng SPHERE làm định dạng audio.
SPH và NIST đều chỉ cùng định dạng SPHERE — SPeech HEader Resources do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ định nghĩa.
Bộ dữ liệu giọng nói thường dùng 8 hoặc 16 kHz. Bộ chuyển đổi tự động điều chỉnh tần số mẫu từ nguồn OGG.
Tải lên hàng loạt bản ghi giọng nói OGG và tạo đầu ra SPH cho từng tệp cùng lúc — chuẩn bị bộ dữ liệu nghiên cứu trong một thao tác.