Công cụ chuyển đổi NIST sang VOC

Chuyển đổi file nist sang voc trực tuyến và miễn phí

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến

Cài đặt

Bộ mã hóa để mã hóa đoạn âm thanh. Bộ mã hóa "Không mã hóa lại" sao chép luồng âm thanh từ tập tin đầu vào sang đầu ra mà không cần mã hóa lại nếu có thể.
Đặt số kênh âm thanh. Cài đặt này hữu ích nhất khi trộn kênh (ví dụ: từ 5.1 sang âm thanh nổi).
Đặt tốc độ lấy mẫu âm thanh. Âm nhạc có phổ đầy đủ (20 Hz - 20 kHz) đòi hỏi các giá trị không thấp hơn 44.1 kHz để đạt đến độ trong trẻo. Bạn có thể tìm hiểu thêm thông tin trên wiki.

nist

NIST SPHERE (SPeech HEader REsources) là định dạng tệp âm thanh chuyên dụng do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ phát triển, phục vụ nghiên cứu giọng nói, đặc biệt các dự án được DARPA tài trợ. Định dạng này đóng gói các mẫu âm thanh thô kèm theo phần header ASCII có cấu trúc, chứa siêu dữ liệu như tần số lấy mẫu, số kênh, kiểu mã hóa, thông tin nhân khẩu học người nói và chú thích phiên âm — lý tưởng cho việc phân phối kho dữ liệu giọng nói. Các tệp NIST thường lưu trữ âm thanh PCM không nén hoặc mu-law ở tần số lấy mẫu chất lượng điện thoại (8 kHz hoặc 16 kHz), dù bộ chứa đủ linh hoạt để hỗ trợ nhiều kiểu mã hóa khác. Ưu điểm nổi bật là phần header tự mô tả phong phú, cho phép nhà nghiên cứu nhúng trực tiếp siêu dữ liệu chi tiết của kho ngữ liệu vào tệp mà không cần tệp đi kèm. SPHERE cũng trở thành tiêu chuẩn thực tế cho các cơ sở dữ liệu giọng nói lớn như TIMIT, Switchboard và Fisher corpus, được công nhận rộng rãi trong các phòng thí nghiệm học thuật và chính phủ. Đặc tả mở và sự sẵn có của các công cụ dòng lệnh (sphere, h_strip, w_decode) giúp việc chuyển đổi, kiểm tra và xử lý các tệp này trở nên đơn giản trong các quy trình xử lý giọng nói.
xem thêm

voc

VOC (Creative Voice) là bộ chứa âm thanh kỹ thuật số do Creative Technology phát triển, ra mắt cùng card Sound Blaster gốc vào năm 1989. Đây là định dạng âm thanh nguyên bản của dòng Sound Blaster trong kỷ nguyên DOS, khi phần cứng của Creative thống trị âm thanh PC. Tệp VOC dựa trên cấu trúc khối: mỗi tệp gồm các khối dữ liệu có kiểu, có thể mang PCM 8-bit không dấu, ADPCM Creative 4-bit và 2,6-bit, PCM 16-bit có dấu, cũng như âm thanh mã hóa A-law và mu-law. Cấu trúc khối này còn hỗ trợ khoảng lặng, vòng lặp lặp lại và điểm đánh dấu, mang lại cho nhà phát triển game khả năng kiểm soát chi tiết việc phát lại âm thanh. Ưu điểm đáng chú ý là giải mã cấp phần cứng — card Sound Blaster có thể phát dữ liệu VOC trực tiếp qua truyền DMA, giải phóng CPU cho các tác vụ khác trong kỷ nguyên mà chu kỳ xử lý vô cùng quý giá. Định dạng được sử dụng rộng rãi trong các game DOS từ id Software, Sierra và LucasArts. Với sự trỗi dậy của Windows và định dạng WAV, VOC dần rời khỏi thị trường chính thống, nhưng vẫn quan trọng cho bảo tồn trò chơi retro và cho bất kỳ ai làm việc với kho lưu trữ âm thanh PC cổ điển.
xem thêm
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Làm thế nào để chuyển đổi NIST sang VOC

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn voc hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin voc của bạn xuống ngay sau đó

Về các định dạng

NIST SPHERE (SPeech HEader REsources) là định dạng tệp âm thanh chuyên dụng do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ phát triển, phục vụ nghiên cứu giọng nói, đặc biệt các dự án được DARPA tài trợ. Định dạng này đóng gói các mẫu âm thanh thô kèm theo phần header ASCII có cấu trúc, chứa siêu dữ liệu như tần số lấy mẫu, số kênh, kiểu mã hóa, thông tin nhân khẩu học người nói và chú thích phiên âm — lý tưởng cho việc phân phối kho dữ liệu giọng nói. Các tệp NIST thường lưu trữ âm thanh PCM không nén hoặc mu-law ở tần số lấy mẫu chất lượng điện thoại (8 kHz hoặc 16 kHz), dù bộ chứa đủ linh hoạt để hỗ trợ nhiều kiểu mã hóa khác. Ưu điểm nổi bật là phần header tự mô tả phong phú, cho phép nhà nghiên cứu nhúng trực tiếp siêu dữ liệu chi tiết của kho ngữ liệu vào tệp mà không cần tệp đi kèm. SPHERE cũng trở thành tiêu chuẩn thực tế cho các cơ sở dữ liệu giọng nói lớn như TIMIT, Switchboard và Fisher corpus, được công nhận rộng rãi trong các phòng thí nghiệm học thuật và chính phủ. Đặc tả mở và sự sẵn có của các công cụ dòng lệnh (sphere, h_strip, w_decode) giúp việc chuyển đổi, kiểm tra và xử lý các tệp này trở nên đơn giản trong các quy trình xử lý giọng nói.
Phát hành lần đầu: 1990
VOC (Creative Voice) là bộ chứa âm thanh kỹ thuật số do Creative Technology phát triển, ra mắt cùng card Sound Blaster gốc vào năm 1989. Đây là định dạng âm thanh nguyên bản của dòng Sound Blaster trong kỷ nguyên DOS, khi phần cứng của Creative thống trị âm thanh PC. Tệp VOC dựa trên cấu trúc khối: mỗi tệp gồm các khối dữ liệu có kiểu, có thể mang PCM 8-bit không dấu, ADPCM Creative 4-bit và 2,6-bit, PCM 16-bit có dấu, cũng như âm thanh mã hóa A-law và mu-law. Cấu trúc khối này còn hỗ trợ khoảng lặng, vòng lặp lặp lại và điểm đánh dấu, mang lại cho nhà phát triển game khả năng kiểm soát chi tiết việc phát lại âm thanh. Ưu điểm đáng chú ý là giải mã cấp phần cứng — card Sound Blaster có thể phát dữ liệu VOC trực tiếp qua truyền DMA, giải phóng CPU cho các tác vụ khác trong kỷ nguyên mà chu kỳ xử lý vô cùng quý giá. Định dạng được sử dụng rộng rãi trong các game DOS từ id Software, Sierra và LucasArts. Với sự trỗi dậy của Windows và định dạng WAV, VOC dần rời khỏi thị trường chính thống, nhưng vẫn quan trọng cho bảo tồn trò chơi retro và cho bất kỳ ai làm việc với kho lưu trữ âm thanh PC cổ điển.
Nhà phát triển: Creative Technology
Phát hành lần đầu: 1989