Công cụ chuyển đổi NIST sang PRC
Chuyển đổi file nist sang prc trực tuyến và miễn phí
nist
prc
Làm thế nào để chuyển đổi NIST sang PRC
Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.
Chọn prc hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)
Hãy để tập tin chuyển đổi và bạn có thể tải tập tin prc của bạn xuống ngay sau đó
Về các định dạng
NIST SPHERE (SPeech HEader REsources) là định dạng tệp âm thanh chuyên dụng do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ phát triển, phục vụ nghiên cứu giọng nói, đặc biệt các dự án được DARPA tài trợ. Định dạng này đóng gói các mẫu âm thanh thô kèm theo phần header ASCII có cấu trúc, chứa siêu dữ liệu như tần số lấy mẫu, số kênh, kiểu mã hóa, thông tin nhân khẩu học người nói và chú thích phiên âm — lý tưởng cho việc phân phối kho dữ liệu giọng nói. Các tệp NIST thường lưu trữ âm thanh PCM không nén hoặc mu-law ở tần số lấy mẫu chất lượng điện thoại (8 kHz hoặc 16 kHz), dù bộ chứa đủ linh hoạt để hỗ trợ nhiều kiểu mã hóa khác. Ưu điểm nổi bật là phần header tự mô tả phong phú, cho phép nhà nghiên cứu nhúng trực tiếp siêu dữ liệu chi tiết của kho ngữ liệu vào tệp mà không cần tệp đi kèm. SPHERE cũng trở thành tiêu chuẩn thực tế cho các cơ sở dữ liệu giọng nói lớn như TIMIT, Switchboard và Fisher corpus, được công nhận rộng rãi trong các phòng thí nghiệm học thuật và chính phủ. Đặc tả mở và sự sẵn có của các công cụ dòng lệnh (sphere, h_strip, w_decode) giúp việc chuyển đổi, kiểm tra và xử lý các tệp này trở nên đơn giản trong các quy trình xử lý giọng nói.
PRC là định dạng tệp âm thanh gắn liền với các thiết bị cầm tay Psion, đặc biệt là dòng Series 3 và Series 5 từ thập niên 1990. Các máy tính bỏ túi này tích hợp micro và khả năng ghi âm cơ bản, lưu trữ âm thanh thu được trong bộ chứa PRC. Kiểu mã hóa thường là ADPCM (Adaptive Differential Pulse-Code Modulation), cân bằng giữa kích thước tệp và độ rõ của âm thanh trong điều kiện dung lượng lưu trữ cực kỳ hạn chế của các PDA đời đầu — Psion Series 3 ban đầu chỉ có 256 KB RAM kiêm luôn bộ nhớ lưu trữ. Âm thanh PRC thường là mono ở tần số lấy mẫu thấp (thường 8 kHz), được tối ưu cho giọng nói thay vì âm nhạc. Một ưu điểm là tích hợp chặt chẽ với hệ điều hành EPOC (sau này phát triển thành Symbian), cho phép người dùng nhúng ghi chú thoại trực tiếp vào các mục lịch và bản ghi cơ sở dữ liệu. Kích thước tệp nhỏ gọn — một phút giọng nói chỉ chiếm vài kilobyte — giúp lưu trữ hàng chục bản ghi nhớ trên thiết bị có bộ nhớ tối thiểu. Dù PRC là định dạng cũ ngày nay, vẫn tồn tại các công cụ chuyển đổi để trích xuất bản ghi âm từ các thiết bị Psion lưu trữ, vốn vẫn được giới sưu tập máy tính cổ điển yêu thích.