Bộ chuyển đổi DIVX sang SPH

Xuất nhạc nền từ video DIVX sang định dạng SPH

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Video sang Corpus giọng nói

Trích xuất lời thoại và giọng nói từ video DivX trực tiếp sang định dạng SPHERE — bỏ qua bước thủ công khi lắp ráp bộ dữ liệu âm thanh nghiên cứu.

Tuân thủ NIST

Tệp SPH đầu ra tuân theo thông số NIST SPHERE. Nhập trực tiếp vào Kaldi, HTK hoặc framework huấn luyện nhận dạng giọng nói khác.

Chạy trên đám mây

Trích xuất âm thanh DivX và mã hóa SPH diễn ra trên máy chủ. Không cần cài bộ công cụ SPHERE hay công cụ âm thanh cục bộ.

Làm thế nào để chuyển đổi DIVX sang SPH

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn sph hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin sph của bạn xuống ngay sau đó

Về các định dạng

DivX là một họ codec video và định dạng bộ chứa phương tiện được phát triển bởi DivX, LLC. Dự án có nguồn gốc từ một phiên bản hack của codec Microsoft MPEG-4 v3 lưu hành vào cuối những năm 1990, nhưng codec DivX chính thức ra mắt vào tháng 1 năm 2001 dưới dạng dự án mã nguồn mở có tên OpenDivX trước khi chuyển thành sản phẩm thương mại độc quyền. Codec dựa trên nén MPEG-4 Part 2 (ASP) và các phiên bản sau đã tích hợp hỗ trợ H.264/AVC và HEVC. DivX trở nên cực kỳ phổ biến vào đầu những năm 2000 nhờ khả năng nén một bộ phim đầy đủ thành tệp đủ nhỏ để vừa vào một đĩa CD-ROM duy nhất mà vẫn giữ được chất lượng hình ảnh có thể xem được. Hiệu suất nén này đã biến DivX thành định dạng tiêu biểu của thời kỳ đầu internet, khi băng thông và dung lượng lưu trữ là tài nguyên khan hiếm. Bộ chứa DivX Media Format (.divx) bổ sung các tính năng như menu tương tác, chương, phụ đề và track âm thanh thay thế, mang chức năng giống DVD đến cho các tệp kỹ thuật số. Chứng nhận DivX trở thành nhãn phổ biến trên các thiết bị điện tử tiêu dùng, với hàng nghìn đầu DVD và thiết bị khác hỗ trợ phát DivX gốc. Codec cũng tiên phong trong mã hóa tốc độ bit thay đổi dựa trên chất lượng, phân bổ nhiều dữ liệu hơn cho các cảnh phức tạp và ít hơn cho các cảnh tĩnh, tạo ra chất lượng hình ảnh nhất quán trong toàn bộ video.
Nhà phát triển: DivX, LLC
Phát hành lần đầu: Ngày 15 tháng 1 năm 2001
SPH là phần mở rộng tệp cho âm thanh lưu trữ trong định dạng NIST SPHERE (SPeech HEader REsources), một tiêu chuẩn do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ tạo ra khoảng năm 1990. Được xây dựng cho nghiên cứu giọng nói, tệp SPH mang header ASCII 1024 byte chứa đầy siêu dữ liệu — mã định danh cơ sở dữ liệu, số kênh, tần số lấy mẫu, thứ tự byte và kiểu nén — giúp mỗi bản ghi tự mô tả. Âm thanh bên dưới thường là PCM tuyến tính 16-bit lấy mẫu ở 16 kHz, dù các cấu hình khác cũng được phép. Các nhà nghiên cứu tại NIST, DARPA và các trường đại học trên toàn thế giới dựa vào SPH để phân phối kho ngữ liệu giọng nói như TIMIT, Switchboard và các bộ sưu tập LDC — nền tảng của các hệ thống nhận dạng giọng nói tự động hiện đại. Ưu điểm chính là header đọc được bằng mắt người cho phép các script phân tích siêu dữ liệu bản ghi mà không cần giải mã nhị phân. Sự chuẩn hóa nghiêm ngặt của định dạng cũng loại bỏ sự mơ hồ khi chia sẻ tập dữ liệu giữa các tổ chức và nền tảng. Vì tệp SPH lưu trữ PCM không nén, chúng bảo toàn toàn bộ chất lượng âm thanh — điều cực kỳ quan trọng khi huấn luyện mô hình âm học mà ngay cả những artifact nhỏ cũng có thể làm lệch kết quả.
Phát hành lần đầu: 1990

Các câu hỏi thường gặp

Tại sao chuyển DivX sang SPH?

SPH (SPHERE) là chuẩn NIST cho âm thanh nghiên cứu giọng nói. Chuyển âm thanh DivX sang SPH chuẩn bị lời thoại video cho bộ dữ liệu ngôn ngữ.

Công cụ nào đọc SPH?

Kaldi, HTK, Praat và bộ công cụ NIST SPHERE đều hỗ trợ tệp SPH. SoX cũng xử lý được định dạng này để xử lý và chuyển đổi.

SPH có bảo toàn chất lượng âm thanh không?

SPH lưu trữ âm thanh PCM không nén. Giọng nói trích từ DivX giữ đầy đủ chất lượng — quan trọng cho dữ liệu nghiên cứu và huấn luyện chính xác.

SPH có giống NIST không?

Có — SPH và NIST đều chỉ định dạng SPHERE được chuẩn hóa bởi Viện Tiêu chuẩn và Công nghệ Quốc gia cho âm thanh giọng nói.

Tôi có thể xử lý nhiều video DivX không?

Tải lên hàng loạt nhiều tệp DivX và chuyển đổi tất cả sang SPH cùng lúc. Tăng tốc xây dựng corpus giọng nói từ kho video.