Bộ chuyển đổi OGG sang SPH

Tạo audio nghiên cứu giọng nói SPHERE từ OGG

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Chuẩn bộ dữ liệu giọng nói

SPH là định dạng đứng sau các bộ dữ liệu giọng nói lớn — chuyển bản ghi OGG thành audio nghiên cứu được định dạng đúng.

Chuẩn bị dữ liệu

Xử lý toàn bộ bộ sưu tập giọng nói OGG sang SPH đồng thời — chuẩn bị bộ dữ liệu nghiên cứu trong một thao tác.

Chuyển đổi trực tuyến

Không cần cài công cụ xử lý giọng nói — tạo tệp SPH từ OGG trực tiếp trên trình duyệt.

Làm thế nào để chuyển đổi OGG sang SPH

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn sph hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin sph của bạn xuống ngay sau đó

Về các định dạng

OGG Vorbis là codec âm thanh nén có tổn hao, mã nguồn mở và miễn phí bản quyền, nằm trong định dạng bộ chứa Ogg, cả hai đều do Xiph.Org Foundation phát triển. Vorbis được thiết kế như giải pháp thay thế không bằng sáng chế cho MP3 và AAC, sử dụng phép biến đổi cosine rời rạc cải tiến (MDCT) với mã hóa tốc độ bit thay đổi thích ứng theo độ phức tạp tín hiệu từng khung. Các thử nghiệm nghe mù liên tục cho thấy Vorbis mang lại chất lượng cảm nhận ngang hoặc vượt trội MP3, đặc biệt trong dải 96-192 kbps. Định dạng hỗ trợ tần số lấy mẫu từ 8 kHz đến 192 kHz và từ 1 đến 255 kênh, bao phủ mọi thứ từ giọng nói mono đến mix âm thanh vòm. Ưu điểm vượt trội là hoàn toàn không có phí cấp phép — nhà phát triển game, nền tảng phát trực tuyến và nhà sản xuất phần cứng có thể triển khai Vorbis mà không lo ngại về bản quyền. Spotify đã dựa vào Vorbis trong nhiều năm làm codec phát trực tuyến chính vì lý do này. Định dạng cũng xử lý suy giảm chất lượng ở tốc độ bit thấp tốt hơn nhiều đối thủ, đó là lý do nó vẫn phổ biến trong trò chơi điện tử nơi dung lượng lưu trữ hạn hẹp và hàng nghìn hiệu ứng âm thanh cạnh tranh không gian. VLC, Firefox, Chrome và Android đều hỗ trợ giải mã Vorbis nguyên bản.
Nhà phát triển: Xiph.Org Foundation
Phát hành lần đầu: Ngày 01 tháng 5 năm 2000
SPH là phần mở rộng tệp cho âm thanh lưu trữ trong định dạng NIST SPHERE (SPeech HEader REsources), một tiêu chuẩn do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ tạo ra khoảng năm 1990. Được xây dựng cho nghiên cứu giọng nói, tệp SPH mang header ASCII 1024 byte chứa đầy siêu dữ liệu — mã định danh cơ sở dữ liệu, số kênh, tần số lấy mẫu, thứ tự byte và kiểu nén — giúp mỗi bản ghi tự mô tả. Âm thanh bên dưới thường là PCM tuyến tính 16-bit lấy mẫu ở 16 kHz, dù các cấu hình khác cũng được phép. Các nhà nghiên cứu tại NIST, DARPA và các trường đại học trên toàn thế giới dựa vào SPH để phân phối kho ngữ liệu giọng nói như TIMIT, Switchboard và các bộ sưu tập LDC — nền tảng của các hệ thống nhận dạng giọng nói tự động hiện đại. Ưu điểm chính là header đọc được bằng mắt người cho phép các script phân tích siêu dữ liệu bản ghi mà không cần giải mã nhị phân. Sự chuẩn hóa nghiêm ngặt của định dạng cũng loại bỏ sự mơ hồ khi chia sẻ tập dữ liệu giữa các tổ chức và nền tảng. Vì tệp SPH lưu trữ PCM không nén, chúng bảo toàn toàn bộ chất lượng âm thanh — điều cực kỳ quan trọng khi huấn luyện mô hình âm học mà ngay cả những artifact nhỏ cũng có thể làm lệch kết quả.
Phát hành lần đầu: 1990

Các câu hỏi thường gặp

Tại sao cần chuyển OGG sang SPH?

SPH (SPHERE) là định dạng NIST cho bộ dữ liệu nghiên cứu giọng nói. Hệ thống huấn luyện ASR và công cụ ngôn ngữ học yêu cầu đầu vào định dạng SPHERE.

Phần mềm nào dùng tệp SPH?

Kaldi, HTK, công cụ đánh giá NIST và bộ dữ liệu giọng nói học thuật như TIMIT và Switchboard dùng SPHERE làm định dạng audio.

SPH có giống NIST không?

SPH và NIST đều chỉ cùng định dạng SPHERE — SPeech HEader Resources do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ định nghĩa.

SPH dùng tần số mẫu nào?

Bộ dữ liệu giọng nói thường dùng 8 hoặc 16 kHz. Bộ chuyển đổi tự động điều chỉnh tần số mẫu từ nguồn OGG.

Tôi có thể chuyển đổi cả bộ dữ liệu không?

Tải lên hàng loạt bản ghi giọng nói OGG và tạo đầu ra SPH cho từng tệp cùng lúc — chuẩn bị bộ dữ liệu nghiên cứu trong một thao tác.

Xếp hạng chất lượng từ OGG đến SPH

4.0 (1 phiếu bầu)
Bạn cần phải chuyển đổi và tải xuống ít nhất 1 tệp để cung cấp phản hồi!