Bộ chuyển đổi OGG sang NIST
Tạo tệp giọng nói NIST SPHERE từ âm thanh OGG
Chuẩn nghiên cứu giọng nói
NIST SPHERE được yêu cầu bởi các bộ công cụ xử lý giọng nói lớn — tạo tệp định dạng đúng từ bản ghi OGG.
Đầu ra sẵn sàng cho kho ngữ liệu
Tạo tệp SPHERE với tiêu đề chính xác, sẵn sàng cho huấn luyện nhận dạng giọng nói và phân tích ngôn ngữ.
Xử lý trực tuyến
Không cần cài đặt bộ công cụ giọng nói — chuyển đổi OGG sang NIST SPHERE trực tiếp qua trình duyệt.
Làm thế nào để chuyển đổi OGG sang NIST
Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.
Chọn nist hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)
Hãy để tập tin chuyển đổi và bạn có thể tải tập tin nist của bạn xuống ngay sau đó
Về các định dạng
Các câu hỏi thường gặp
NIST SPHERE là định dạng chuẩn cho tập dữ liệu nghiên cứu giọng nói. Công cụ nghiên cứu ngôn ngữ và pipeline huấn luyện ASR mong đợi âm thanh định dạng SPHERE.
HTK, Kaldi, công cụ đánh giá giọng nói NIST và kho ngữ liệu nghiên cứu giọng nói học thuật sử dụng SPHERE làm định dạng âm thanh chính.
Đúng — NIST SPHERE (SPeech HEader Resources) được định nghĩa bởi Viện Tiêu chuẩn và Công nghệ Quốc gia cho sử dụng nghiên cứu giọng nói.
Tệp SPHERE thường sử dụng 8 hoặc 16 kHz — tần số chuẩn cho nghiên cứu giọng nói điện thoại và băng rộng.
Tải lên toàn bộ tập dữ liệu giọng nói OGG và chuyển sang NIST SPHERE trong một lần — sẵn sàng cho pipeline nghiên cứu.