เครื่องมือแปลงไฟล์ SOU เป็น HTK

แปลงไฟล์ sou ของคุณให้เป็น htk ผ่านช่องทางออนไลน์ฟรี

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิธีแปลง SOU เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

SOU เป็นการกำหนดรูปแบบเสียงดิบที่ทำหน้าที่เป็นนามแฝงสำหรับข้อมูล PCM แบบ 8 บิตไม่มีเครื่องหมาย (u8) ในเฟรมเวิร์กประมวลผลเสียง SoX ไฟล์ที่มีนามสกุล .sou ประกอบด้วยตัวอย่างเสียงดิบที่ไม่บีบอัดแบบไม่มีส่วนหัว จัดเก็บเป็นจำนวนเต็ม 8 บิตไม่มีเครื่องหมาย — แต่ละไบต์แทนค่าแอมพลิจูดเดียวตั้งแต่ 0 ถึง 255 โดย 128 เป็นจุดกลางที่เงียบ เนื่องจากไม่มีส่วนหัว พารามิเตอร์การเล่นเช่นอัตราสุ่มตัวอย่างและจำนวนช่องสัญญาณต้องระบุจากภายนอก ค่าเริ่มต้นโดยทั่วไปคือโมโนที่ 8000 Hz แม้ว่าข้อมูลจะแทนอัตราใดก็ได้ที่ฮาร์ดแวร์บันทึกรองรับ การเข้ารหัส u8 ที่ SOU เป็นนามแฝงเป็นหนึ่งในการแสดงเสียงดิจิทัลที่เรียบง่ายที่สุด มีมาก่อนคอนเทนเนอร์เสียงแบบมีโครงสร้างเช่น WAV และ AIFF PCM แบบดิบไม่มีเครื่องหมายถูกผลิตทั่วไปโดยการ์ดเสียงและดิจิไทเซอร์ยุคแรกในช่วงปลายทศวรรษ 1980 และต้นทศวรรษ 1990 เมื่อข้อจำกัดด้านพื้นที่จัดเก็บและพลังการประมวลผลทำให้รูปแบบที่ไม่มีส่วนหัวเป็นตัวเลือกที่เหมาะสม ข้อดีคือความเรียบง่ายอย่างสุดขั้ว — ไฟล์ SOU สามารถอ่านได้โดยโปรแกรมใดก็ได้ที่ทำ I/O ไฟล์พื้นฐาน โดยไม่ต้องแยกวิเคราะห์โครงสร้างคอนเทนเนอร์หรือถอดรหัสเมทาดาทา การแปลงเป็นคอนเทนเนอร์สมัยใหม่ใดๆ ก็ไม่สูญเสียคุณภาพและรวดเร็ว เนื่องจากสามารถห่อหุ้มตัวอย่าง PCM ดิบในส่วนหัว WAV หรือ AIFF ได้โดยไม่ต้องแปลงรหัสใดๆ
ผู้พัฒนา: SoX Contributors
เผยแพร่ครั้งแรก: 1991
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993