Konverter HTK ke MAUD

Konversikan file htk ke maud secara online & gratis

Taruh file di sini. 1 GB Ukuran file maksimum atau Daftar
untuk
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Bagaimana cara mengubah HTK ke MAUD

1

Pilih file dari Komputer, Google Drive, Dropbox, URL, atau dengan menyeret ke halaman ini.

2

Pilih maud atau format lainnya yang Anda inginkan (mendukung lebih dari 200 format)

3

Tunggu proses konversi selesai dan Anda dapat mengunduh maud setelahnya

Tentang format

HTK adalah kontainer bentuk gelombang native untuk Hidden Markov Model Toolkit, paket perangkat lunak yang dikembangkan di Departemen Teknik Universitas Cambridge untuk penelitian pengenalan ucapan. Pertama kali didistribusikan pada tahun 1993, HTK dengan cepat menjadi platform referensi di laboratorium linguistik komputasional di seluruh dunia, dan format file-nya mengikuti. Setiap file menyimpan urutan vektor parameter atau sampel mentah yang didahului oleh header 12-byte yang menentukan jumlah frame, periode frame dalam satuan 100 ns, jumlah byte per frame, dan kode tipe yang menunjukkan jenis data — opsi berkisar dari PCM bentuk gelombang hingga koefisien cepstral frekuensi Mel dan energi filter-bank. Keserbagunaan ini memungkinkan satu kontainer membawa audio sumber dan fitur yang diekstrak tanpa mengubah parser. Header yang sengaja minimal menghindari padding alignment atau chunk opsional, membuat format ini sangat mudah dibaca dari C, Python, atau MATLAB dengan beberapa baris I/O biner. Tiga keunggulan mendukung relevansi HTK yang bertahan lama: integrasi erat dengan pipeline pelatihan dan pengenalan HTK, tata letak byte deterministik yang menghilangkan ambiguitas parser, dan adopsi yang luas dalam korpora akademik.
Rilis awal: 1993
MAUD adalah format file audio yang dikembangkan oleh MacroSystem untuk platform Commodore Amiga, diperkenalkan pada awal 1990-an sebagai bagian dari tool produksi video dan audio digital mereka. Dibangun di atas arsitektur chunk IFF (Interchange File Format) Amiga, file MAUD mengorganisasi data ke dalam chunk yang terdefinisi dengan jelas — MHDR untuk header, MDAT untuk data sampel, dan chunk anotasi opsional untuk metadata. Format ini mendukung tata letak mono dan stereo dengan kedalaman bit 8 atau 16 bit dan sample rate hingga 48 kHz, yang mewakili spesifikasi kelas profesional pada perangkat keras Amiga. Encoding PCM linear bertanda dan A-law/mu-law keduanya tersedia, menawarkan pilihan antara fidelitas dan ukuran file. MAUD terutama digunakan dalam komunitas produksi video Amiga, di mana papan MacroSystem Retina dan VLab Motion memerlukan audio yang tersinkronisasi yang tidak dapat diberikan oleh format 8SVX standar. Dukungan konversi tersedia saat ini melalui SoX dan libsndfile, memastikan produksi Amiga vintage tetap dapat dipulihkan. Tiga keunggulan yang menonjol: struktur berbasis IFF yang bersih yang dapat dinavigasi oleh parser yang sadar chunk, kemampuan stereo 16-bit yang melampaui audio Amiga biasa, dan overhead ringan yang menyisakan ruang CPU maksimum untuk rendering video.
Rilis awal: 1992