Konverter HTK ke VOC
Konversikan file htk ke voc secara online & gratis
htk
voc
Pengaturan
PCM_S16LE (Tanpa kompresi)
Codec untuk mengodekan trek audio. Codec "Tanpa pengodean ulang" menyalin aliran audio dari berkas input menjadi output tanpa pengodean ulang bila memungkinkan.
Otomatis (Tak diubah)
Atur jumlah kanal audio. Pengaturan ini paling berguna saat melakukan downmixing kanal (cth: dari 5.1 ke stereo).
Otomatis (Tak diubah)
Atur tingkat sampel audio. Musik dengan spektrum penuh (20 Hz — 20 kHz) memerlukan nilai yang tidak lebih rendah dari 44.1 kHz untuk mencapai transparansi. Info lebih lanjut dapat dilihat di wiki.
htk
HTK adalah kontainer bentuk gelombang native untuk Hidden Markov Model Toolkit, paket perangkat lunak yang dikembangkan di Departemen Teknik Universitas Cambridge untuk penelitian pengenalan ucapan. Pertama kali didistribusikan pada tahun 1993, HTK dengan cepat menjadi platform referensi di laboratorium linguistik komputasional di seluruh dunia, dan format file-nya mengikuti. Setiap file menyimpan urutan vektor parameter atau sampel mentah yang didahului oleh header 12-byte yang menentukan jumlah frame, periode frame dalam satuan 100 ns, jumlah byte per frame, dan kode tipe yang menunjukkan jenis data — opsi berkisar dari PCM bentuk gelombang hingga koefisien cepstral frekuensi Mel dan energi filter-bank. Keserbagunaan ini memungkinkan satu kontainer membawa audio sumber dan fitur yang diekstrak tanpa mengubah parser. Header yang sengaja minimal menghindari padding alignment atau chunk opsional, membuat format ini sangat mudah dibaca dari C, Python, atau MATLAB dengan beberapa baris I/O biner. Tiga keunggulan mendukung relevansi HTK yang bertahan lama: integrasi erat dengan pipeline pelatihan dan pengenalan HTK, tata letak byte deterministik yang menghilangkan ambiguitas parser, dan adopsi yang luas dalam korpora akademik.
selengkapnya
voc
VOC (Creative Voice) adalah kontainer audio digital yang dikembangkan oleh Creative Technology dan diperkenalkan bersamaan dengan kartu Sound Blaster asli pada tahun 1989. Format ini berfungsi sebagai format audio native untuk keluarga Sound Blaster selama era DOS, ketika perangkat keras Creative mendominasi audio PC. File VOC berbasis blok: setiap file terdiri dari blok data bertipe yang dapat membawa PCM unsigned 8-bit, ADPCM Creative 4-bit dan 2,6-bit, PCM signed 16-bit, serta audio yang dikodekan A-law dan mu-law. Struktur blok ini juga mendukung interval keheningan, loop pengulangan, dan titik penanda, memberikan pengembang game kontrol yang detail atas pemutaran suara. Keunggulan yang menonjol adalah decoding tingkat perangkat keras — kartu Sound Blaster dapat memutar data VOC langsung melalui transfer DMA, membebaskan CPU untuk tugas lain di era ketika siklus prosesor sangat berharga. Format ini banyak digunakan dalam game DOS dari id Software, Sierra, dan LucasArts. Dengan munculnya Windows dan format WAV, VOC secara bertahap keluar dari penggunaan mainstream, namun tetap penting untuk pelestarian game retro dan bagi siapa pun yang bekerja dengan arsip audio PC vintage.
selengkapnya
Bagaimana cara mengubah HTK ke VOC
Pilih file dari Komputer, Google Drive, Dropbox, URL, atau dengan menyeret ke halaman ini.
Pilih voc atau format lainnya yang Anda inginkan (mendukung lebih dari 200 format)
Tunggu proses konversi selesai dan Anda dapat mengunduh voc setelahnya
Tentang format
HTK adalah kontainer bentuk gelombang native untuk Hidden Markov Model Toolkit, paket perangkat lunak yang dikembangkan di Departemen Teknik Universitas Cambridge untuk penelitian pengenalan ucapan. Pertama kali didistribusikan pada tahun 1993, HTK dengan cepat menjadi platform referensi di laboratorium linguistik komputasional di seluruh dunia, dan format file-nya mengikuti. Setiap file menyimpan urutan vektor parameter atau sampel mentah yang didahului oleh header 12-byte yang menentukan jumlah frame, periode frame dalam satuan 100 ns, jumlah byte per frame, dan kode tipe yang menunjukkan jenis data — opsi berkisar dari PCM bentuk gelombang hingga koefisien cepstral frekuensi Mel dan energi filter-bank. Keserbagunaan ini memungkinkan satu kontainer membawa audio sumber dan fitur yang diekstrak tanpa mengubah parser. Header yang sengaja minimal menghindari padding alignment atau chunk opsional, membuat format ini sangat mudah dibaca dari C, Python, atau MATLAB dengan beberapa baris I/O biner. Tiga keunggulan mendukung relevansi HTK yang bertahan lama: integrasi erat dengan pipeline pelatihan dan pengenalan HTK, tata letak byte deterministik yang menghilangkan ambiguitas parser, dan adopsi yang luas dalam korpora akademik.
VOC (Creative Voice) adalah kontainer audio digital yang dikembangkan oleh Creative Technology dan diperkenalkan bersamaan dengan kartu Sound Blaster asli pada tahun 1989. Format ini berfungsi sebagai format audio native untuk keluarga Sound Blaster selama era DOS, ketika perangkat keras Creative mendominasi audio PC. File VOC berbasis blok: setiap file terdiri dari blok data bertipe yang dapat membawa PCM unsigned 8-bit, ADPCM Creative 4-bit dan 2,6-bit, PCM signed 16-bit, serta audio yang dikodekan A-law dan mu-law. Struktur blok ini juga mendukung interval keheningan, loop pengulangan, dan titik penanda, memberikan pengembang game kontrol yang detail atas pemutaran suara. Keunggulan yang menonjol adalah decoding tingkat perangkat keras — kartu Sound Blaster dapat memutar data VOC langsung melalui transfer DMA, membebaskan CPU untuk tugas lain di era ketika siklus prosesor sangat berharga. Format ini banyak digunakan dalam game DOS dari id Software, Sierra, dan LucasArts. Dengan munculnya Windows dan format WAV, VOC secara bertahap keluar dari penggunaan mainstream, namun tetap penting untuk pelestarian game retro dan bagi siapa pun yang bekerja dengan arsip audio PC vintage.