Bộ chuyển đổi OGV sang SPH

Trích xuất âm thanh NIST SPHERE từ video Ogg

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Đầu ra chuyên dụng

SPH phục vụ tập dữ liệu nghiên cứu giọng nói. Chuyển âm thanh OGV sang đúng định dạng hệ thống đích yêu cầu.

Chuyển đổi đám mây

Trích xuất SPH từ OGV chạy trên máy chủ — không cần phần mềm chuyên dụng trên máy tính.

Xử lý an toàn

Video OGV tải lên được xóa sau khi chuyển đổi. Đầu ra SPH được xóa khỏi máy chủ trong vòng 24 giờ.

Làm thế nào để chuyển đổi OGV sang SPH

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn sph hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin sph của bạn xuống ngay sau đó

Về các định dạng

OGV (Ogg Video) là định dạng đa phương tiện mở kết hợp codec video Theora với bộ chứa Ogg, cả hai được phát triển bởi Xiph.Org Foundation như giải pháp thay thế miễn phí bản quyền cho các định dạng phương tiện độc quyền. Theora 1.0 đạt phiên bản ổn định vào tháng 11 năm 2008, mặc dù quá trình phát triển đã diễn ra từ năm 2002 dựa trên codec VP3 do On2 Technologies tặng. Theora nén video bằng bù chuyển động dựa trên khối với mã hóa biến đổi cosin rời rạc, đạt chất lượng gần tương đương MPEG-4 Part 2 ở tốc độ bit tương tự. Bộ chứa Ogg sử dụng lược đồ ghép kênh dựa trên trang xen kẽ video Theora với âm thanh Vorbis hoặc Opus, hỗ trợ các tính năng như luồng nối tiếp cho ghép liền mạch và luồng ghép kênh cho phát lại đa phương tiện đồng bộ. OGV có ý nghĩa lịch sử trong nỗ lực thúc đẩy tiêu chuẩn web mở, phục vụ như một trong những định dạng video có thể triển khai tự do đầu tiên được đề xuất cho phần tử video HTML5. Firefox và Chrome đều tích hợp hỗ trợ OGV gốc, chứng minh rằng video web có thể hoạt động mà không phụ thuộc vào plugin độc quyền hoặc codec có giấy phép. Định dạng cũng hỗ trợ âm thanh FLAC không mất dữ liệu, luồng phụ đề Kate và siêu dữ liệu Skeleton trong bộ chứa Ogg. Mặc dù WebM và AV1 phần lớn đã thay thế OGV trong hệ sinh thái video mã nguồn mở, định dạng vẫn có sẵn trong các bản phân phối Linux, công cụ phương tiện mã nguồn mở và bối cảnh mà sự tự do hoàn toàn khỏi lo ngại bằng sáng chế là ưu tiên.
Nhà phát triển: Xiph.Org Foundation
Phát hành lần đầu: Ngày 03 tháng 11 năm 2008
SPH là phần mở rộng tệp cho âm thanh lưu trữ trong định dạng NIST SPHERE (SPeech HEader REsources), một tiêu chuẩn do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ tạo ra khoảng năm 1990. Được xây dựng cho nghiên cứu giọng nói, tệp SPH mang header ASCII 1024 byte chứa đầy siêu dữ liệu — mã định danh cơ sở dữ liệu, số kênh, tần số lấy mẫu, thứ tự byte và kiểu nén — giúp mỗi bản ghi tự mô tả. Âm thanh bên dưới thường là PCM tuyến tính 16-bit lấy mẫu ở 16 kHz, dù các cấu hình khác cũng được phép. Các nhà nghiên cứu tại NIST, DARPA và các trường đại học trên toàn thế giới dựa vào SPH để phân phối kho ngữ liệu giọng nói như TIMIT, Switchboard và các bộ sưu tập LDC — nền tảng của các hệ thống nhận dạng giọng nói tự động hiện đại. Ưu điểm chính là header đọc được bằng mắt người cho phép các script phân tích siêu dữ liệu bản ghi mà không cần giải mã nhị phân. Sự chuẩn hóa nghiêm ngặt của định dạng cũng loại bỏ sự mơ hồ khi chia sẻ tập dữ liệu giữa các tổ chức và nền tảng. Vì tệp SPH lưu trữ PCM không nén, chúng bảo toàn toàn bộ chất lượng âm thanh — điều cực kỳ quan trọng khi huấn luyện mô hình âm học mà ngay cả những artifact nhỏ cũng có thể làm lệch kết quả.
Phát hành lần đầu: 1990

Các câu hỏi thường gặp

Tại sao nên chuyển OGV sang SPH?

SPH được thiết kế cho tập dữ liệu nghiên cứu giọng nói. Trích xuất âm thanh OGV vào định dạng chuyên dụng này cho các ứng dụng phù hợp.

Ứng dụng nào sử dụng SPH?

Các ứng dụng và hệ thống cho tập dữ liệu nghiên cứu giọng nói chấp nhận SPH làm định dạng âm thanh đầu vào gốc.

SPH có tương thích rộng rãi không?

SPH là định dạng chuyên dụng. SOX và các công cụ chuyên biệt xử lý được; các trình phát thông thường có thể không hỗ trợ.

Chất lượng có đảm bảo không?

Chất lượng SPH phù hợp với mục đích sử dụng — các ứng dụng tập dữ liệu nghiên cứu giọng nói hoạt động tối ưu với định dạng này.

Có thể chuyển hàng loạt không?

Tải lên nhiều video OGV và trích xuất âm thanh SPH từ mỗi video đồng thời để xử lý hiệu quả.