Chuyển đổi AV1 sang NIST

Trích xuất âm thanh NIST từ video AV1 trực tuyến

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Tiêu chuẩn nghiên cứu

NIST là tiêu chuẩn trong nghiên cứu — chuyển đổi từ AV1 tạo âm thanh sẵn sàng cho phân tích và đánh giá.

Cài đặt kho ngữ liệu

Chọn tần số lấy mẫu và độ sâu bit phù hợp yêu cầu sản xuất hoặc chỉnh sửa âm thanh cụ thể.

Chuyển đổi an toàn

Tệp AV1 tải lên được xóa ngay sau khi xử lý, đầu ra NIST được xóa tự động trong vòng 24 giờ để bảo vệ quyền riêng tư.

Làm thế nào để chuyển đổi AV1 sang NIST

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn nist hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin nist của bạn xuống ngay sau đó

Về các định dạng

AV1 (AOMedia Video 1) là định dạng mã hóa video mở, miễn phí bản quyền được phát triển bởi Alliance for Open Media — một hiệp hội có các thành viên sáng lập bao gồm Google, Mozilla, Microsoft, Amazon, Netflix và Intel, cùng nhiều tổ chức khác. Thông số kỹ thuật được hoàn thiện vào tháng 6 năm 2018 với mục tiêu cung cấp codec video thế hệ tiếp theo vượt qua hiệu suất nén của H.264 và HEVC đồng thời không có phí cấp phép. AV1 đạt hiệu suất nén tốt hơn khoảng 30-50% so với HEVC ở chất lượng hình ảnh tương đương, khiến nó đặc biệt hấp dẫn đối với các nền tảng truyền phát muốn giảm chi phí băng thông mà không hy sinh trải nghiệm người xem. Codec hỗ trợ nhiều tính năng bao gồm tổng hợp nhiễu hạt phim, phân chia ô linh hoạt để xử lý song song, chuyển đổi độ phân giải thích ứng nội dung và bộ chế độ dự đoán intra và inter phong phú. Hỗ trợ giải mã phần cứng đã mở rộng nhanh chóng trên các bộ xử lý di động, GPU và TV thông minh, giải quyết những lo ngại ban đầu về yêu cầu tính toán trong quá trình mã hóa. AV1 đã được các dịch vụ truyền phát lớn áp dụng rộng rãi để phân phối nội dung 4K và HDR, đồng thời đóng vai trò là thành phần video của bộ chứa WebM cho phát lại trên web. Việc miễn phí bản quyền khiến AV1 đặc biệt quan trọng cho các tiêu chuẩn web mở và phân phối phương tiện dễ tiếp cận.
Nhà phát triển: Alliance for Open Media
Phát hành lần đầu: Ngày 25 tháng 6 năm 2018
NIST SPHERE (SPeech HEader REsources) là định dạng tệp âm thanh chuyên dụng do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ phát triển, phục vụ nghiên cứu giọng nói, đặc biệt các dự án được DARPA tài trợ. Định dạng này đóng gói các mẫu âm thanh thô kèm theo phần header ASCII có cấu trúc, chứa siêu dữ liệu như tần số lấy mẫu, số kênh, kiểu mã hóa, thông tin nhân khẩu học người nói và chú thích phiên âm — lý tưởng cho việc phân phối kho dữ liệu giọng nói. Các tệp NIST thường lưu trữ âm thanh PCM không nén hoặc mu-law ở tần số lấy mẫu chất lượng điện thoại (8 kHz hoặc 16 kHz), dù bộ chứa đủ linh hoạt để hỗ trợ nhiều kiểu mã hóa khác. Ưu điểm nổi bật là phần header tự mô tả phong phú, cho phép nhà nghiên cứu nhúng trực tiếp siêu dữ liệu chi tiết của kho ngữ liệu vào tệp mà không cần tệp đi kèm. SPHERE cũng trở thành tiêu chuẩn thực tế cho các cơ sở dữ liệu giọng nói lớn như TIMIT, Switchboard và Fisher corpus, được công nhận rộng rãi trong các phòng thí nghiệm học thuật và chính phủ. Đặc tả mở và sự sẵn có của các công cụ dòng lệnh (sphere, h_strip, w_decode) giúp việc chuyển đổi, kiểm tra và xử lý các tệp này trở nên đơn giản trong các quy trình xử lý giọng nói.
Phát hành lần đầu: 1990

Các câu hỏi thường gặp

Tại sao chuyển đổi AV1 sang NIST?

NIST Sphere là định dạng trao đổi tiêu chuẩn cho dữ liệu nghiên cứu giọng nói — được sử dụng bởi chương trình đánh giá giọng nói chính phủ và học thuật.

Phần mềm nào phát tệp NIST?

Công cụ NIST speech, SoX, Kaldi và HTK xử lý âm thanh NIST Sphere cho mục đích nghiên cứu và đánh giá.

NIST khác gì nên với định dạng tương tự?

NIST và SPH đề cập đến cùng định dạng NIST Sphere — phần mở rộng tệp khác nhau cho cùng đặc tả container âm thanh.

Nên chọn cài đặt nào?

Nghiên cứu giọng nói thường yêu cầu 8 kHz hoặc 16 kHz, 16-bit mono — phù hợp với thông số kỹ thuật corpus của bạn.

Tệp của tôi có an toàn không?

Tệp AV1 tải lên được xóa ngay lập tức. Đầu ra NIST được xóa khỏi máy chủ trong vòng 24 giờ.