Chuyển đổi TS sang HTK

Trích xuất âm thanh HTK từ bản ghi TS trực tuyến

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Đầu ra chuyên biệt

HTK phục vụ định dạng cho nghiên cứu nhận dạng giọng nói. Trích xuất đúng định dạng cần thiết từ nguồn TS.

Xử lý đám mây

Quá trình trích xuất chạy trên máy chủ — không cần công cụ đặc biệt trên máy bạn.

Bảo mật tệp

Tệp TS tải lên được xóa sau khi chuyển đổi. Đầu ra HTK được xóa trong vòng 24 giờ.

Làm thế nào để chuyển đổi TS sang HTK

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn htk hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin htk của bạn xuống ngay sau đó

Về các định dạng

TS (MPEG Transport Stream) là định dạng bộ chứa tiêu chuẩn được quy định như một phần của lớp hệ thống MPEG-2 (ISO/IEC 13818-1), chuẩn hóa bởi Moving Picture Experts Group năm 1995. Transport stream được thiết kế cho các môi trường truyền thông và lưu trữ nơi mất mát hoặc hỏng dữ liệu có thể xảy ra, chẳng hạn như truyền hình phát sóng, truyền vệ tinh và truyền phát mạng. Định dạng chia nội dung thành các gói cố định 188 byte, mỗi gói mang tiêu đề 4 byte với thông tin đồng bộ, chỉ báo lỗi và nhận dạng luồng. Cấu trúc gói này cho phép thiết bị nhận tái đồng bộ nhanh chóng sau khi tín hiệu bị gián đoạn — khả năng quan trọng cho truyền tải phát sóng thời gian thực, phân biệt transport stream với program stream được thiết kế cho phương tiện lưu trữ đáng tin cậy. TS có thể ghép kênh nhiều chương trình vào một luồng duy nhất, với các bảng Program Specific Information (PSI) mô tả cấu trúc và nội dung của từng chương trình. Định dạng hỗ trợ hầu như mọi codec âm thanh và video, mặc dù thường mang video MPEG-2, H.264 hoặc HEVC cùng với âm thanh AAC, AC-3 hoặc MPEG. TS là xương sống của truyền tải truyền hình kỹ thuật số trên toàn thế giới, được sử dụng bởi các tiêu chuẩn phát sóng DVB, ATSC và ISDB cũng như dịch vụ truyền phát IPTV và OTT sử dụng HTTP Live Streaming (HLS). Tính bền bỉ, cấu trúc chuẩn hóa và hỗ trợ codec rộng rãi khiến TS phù hợp cả trong chuỗi phát sóng trực tiếp và quy trình ghi dựa trên tệp.
Nhà phát triển: Moving Picture Experts Group
Phát hành lần đầu: 1995
HTK là container dạng sóng gốc cho Hidden Markov Model Toolkit, bộ phần mềm được phát triển tại Khoa Kỹ thuật Đại học Cambridge phục vụ nghiên cứu nhận dạng giọng nói. Phân phối lần đầu vào năm 1993, HTK nhanh chóng trở thành nền tảng tham chiếu trong các phòng thí nghiệm ngôn ngữ học tính toán trên toàn thế giới, và định dạng tệp của nó cũng lan rộng theo. Mỗi tệp lưu một chuỗi vector tham số hoặc mẫu thô kèm tiêu đề 12 byte chỉ định số khung, chu kỳ khung tính bằng đơn vị 100 ns, số byte mỗi khung, và mã loại chỉ ra kiểu dữ liệu — các tùy chọn dao động từ PCM dạng sóng đến hệ số cepstral tần số Mel và năng lượng bộ lọc. Tính đa dụng này cho phép một container duy nhất chứa cả âm thanh nguồn lẫn đặc trưng đã trích xuất mà không cần thay đổi bộ phân tích. Tiêu đề cố ý tối giản không có padding căn chỉnh hay khối tùy chọn, khiến định dạng cực kỳ dễ đọc từ C, Python hoặc MATLAB chỉ với vài dòng I/O nhị phân. Ba ưu điểm làm nên sự bền vững của HTK: tích hợp chặt chẽ với pipeline huấn luyện và nhận dạng HTK, bố trí byte xác định loại bỏ mơ hồ trong phân tích, và được áp dụng rộng rãi trong các kho dữ liệu học thuật.
Phát hành lần đầu: 1993

Các câu hỏi thường gặp

Tại sao chuyển đổi TS sang HTK?

HTK là định dạng cho nghiên cứu nhận dạng giọng nói. Chuyển đổi trích xuất dữ liệu âm thanh tương thích từ bản ghi TS.

Phần mềm nào xử lý được HTK?

Các công cụ âm thanh chuyên dụng, SoX và ứng dụng hỗ trợ định dạng này xử lý tệp HTK.

HTK có được hỗ trợ rộng rãi không?

HTK phục vụ trường hợp sử dụng đặc thù. Với âm thanh thông thường, MP3, WAV hoặc FLAC phổ biến hơn.

Có thể điều chỉnh cài đặt không?

Có — cấu hình tần số lấy mẫu và thông số mã hóa trước khi chuyển đổi.

Có hỗ trợ chuyển đổi hàng loạt không?

Tải lên nhiều tệp TS và trích xuất HTK từ từng tệp đồng thời trong một phiên.