เครื่องมือแปลงไฟล์ HTK เป็น SLN
แปลงไฟล์ htk ของคุณให้เป็น sln ผ่านช่องทางออนไลน์ฟรี
htk
sln
วิธีแปลง HTK เป็น SLN
เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.
เลือกรูปแบบไฟล์ sln หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)
ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sln ของคุณได้หลังจากนั้น
เกี่ยวกับรูปแบบไฟล์
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
SLN (Signed Linear) เป็นรูปแบบเสียงดิบแบบไม่มีส่วนหัว จัดเก็บตัวอย่าง PCM เชิงเส้นแบบมีเครื่องหมาย 16 บิตที่ 8000 Hz โมโน เกี่ยวข้องอย่างใกล้ชิดกับ Asterisk — เฟรมเวิร์ก PBX แบบโอเพนซอร์สที่พัฒนาโดย Digium (ปัจจุบันคือ Sangoma Technologies) ภายใน Asterisk SLN ทำหน้าที่เป็นการแสดงเสียงภายในดั้งเดิม — ทุกการแปลงโคเดกจะผ่าน signed linear เป็นขั้นตอนกลาง ทำให้ SLN เป็นกระดูกสันหลังของสถาปัตยกรรมการแปลโคเดกของ Asterisk รูปแบบนี้ไม่มีอะไรนอกจากตัวอย่างดิบ — ไม่มีส่วนหัว ไม่มีเมทาดาทา ไม่มีเฟรม — ดังนั้นพารามิเตอร์จะต้องทราบล่วงหน้า แม้ว่าการขาดการอธิบายตัวเองอาจดูเป็นข้อจำกัด แต่จริงๆ แล้วเป็นข้อดีในงานโทรศัพท์ที่รูปแบบตัวอย่างเป็นแบบตายตัวตามธรรมเนียมและทุกไบต์โอเวอร์เฮดมีความสำคัญเมื่อมีช่องสัญญาณพร้อมกันหลายพันช่อง อัตรา 8000 Hz สอดคล้องกับมาตรฐาน G.711 สำหรับโทรศัพท์แบบดั้งเดิม ครอบคลุมแบนด์เสียงพูดเต็ม 300-3400 Hz Asterisk ยังรองรับตัวแปรเพิ่มเติม (sln16, sln32, sln48) สำหรับเสียงแบนด์กว้าง ไฟล์ SLN ไม่ต้องการการถอดรหัส — เพียงแค่แมปหน่วยความจำโดยตรง — ทำให้เหมาะอย่างยิ่งสำหรับการมิกซ์แบบเรียลไทม์ การประชุมทางเสียง และการเล่นพรอมต์ในสภาพแวดล้อม VoIP ที่มีความหนาแน่นสูง