เครื่องมือแปลงไฟล์ HTK เป็น AU

แปลงไฟล์ htk ของคุณให้เป็น au ผ่านช่องทางออนไลน์ฟรี

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิธีแปลง HTK เป็น AU

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ au หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ au ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993
AU เป็นรูปแบบไฟล์เสียงที่เปิดตัวโดย Sun Microsystems สำหรับเวิร์กสเตชัน Unix และแพลตฟอร์ม NeXT มีส่วนหัวขนาดเล็กเพียง 24 ไบต์ที่ระบุตำแหน่งข้อมูล ขนาด ประเภทการเข้ารหัส อัตราสุ่มตัวอย่าง และจำนวนแชนเนล ตามด้วยข้อมูลเสียง AU รองรับการเข้ารหัสหลายแบบ ได้แก่ linear PCM แบบไม่บีบอัดที่ความลึกบิตต่าง ๆ, mu-law และ A-law companding (การบีบอัดแบบลอการิทึมที่ใช้ในระบบโทรศัพท์) และตัวแปร ADPCM หลายชนิด ความหลากหลายนี้ทำให้ AU เป็นม้าศึกในสภาพแวดล้อม Unix ยุคแรก เสียงเว็บ (Java applets ใช้ AU เป็นค่าเริ่มต้น) และแอปพลิเคชันโทรศัพท์ ข้อดีคือความเรียบง่าย: ส่วนหัวขนาดกะทัดรัดและโครงสร้างตรงไปตรงมาทำให้การแยกวิเคราะห์ สร้าง และสตรีมทำได้ง่ายมากในเชิงโปรแกรม ตัวเลือก mu-law ในตัวให้ข้อดีเพิ่มเติม ให้คุณภาพเสียงพูดที่เหมาะสมที่เพียง 8 KB ต่อวินาที — ครึ่งหนึ่งของอัตราเสียง 16 บิตแบบไม่บีบอัด — มีค่ามากเมื่อพื้นที่จัดเก็บและแบนด์วิดท์ยังมีจำกัด แม้รูปแบบสมัยใหม่จะเข้ามาแทนที่ AU ในแอปพลิเคชันสำหรับผู้บริโภคเป็นส่วนใหญ่ แต่ยังคงมีที่ยืนในการคำนวณเชิงวิทยาศาสตร์และท่อประมวลผลเสียงที่ต้องการค่าใช้จ่ายน้อยที่สุดและพฤติกรรมข้ามแพลตฟอร์มที่เชื่อถือได้
ผู้พัฒนา: Sun Microsystems
เผยแพร่ครั้งแรก: 1992