เครื่องมือแปลงไฟล์ GSM เป็น HTK
แปลงไฟล์ gsm ของคุณให้เป็น htk ผ่านช่องทางออนไลน์ฟรี
gsm
htk
วิธีแปลง GSM เป็น HTK
เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.
เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)
ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น
เกี่ยวกับรูปแบบไฟล์
GSM 06.10 (Full Rate) เป็นตัวแปลงสัญญาณเสียงพูดพื้นฐานของมาตรฐาน Global System for Mobile Communications ได้รับการรับรองโดย ETSI ในปี 1991 และใช้งานในเครือข่ายเซลลูลาร์หลายร้อยแห่งทั่วโลก ทำงานที่อัตราคงที่ 13 kbit/s อัลกอริทึมใช้ Regular Pulse Excitation with Long-Term Prediction (RPE-LTP) เพื่อบีบอัดเฟรมเสียงพูดขนาด 20 ms ที่ 8 kHz โมโนเหลือเพียง 33 ไบต์ต่อเฟรม วิธีนี้สร้างแบบจำลองช่องเสียงเป็น linear predictive filter เข้ารหัสสัญญาณกระตุ้น และใช้ประโยชน์จากคาบพิทช์เพื่อลดขนาดเพิ่มเติม — ปรับให้ส่งเสียงพูดที่ชัดเจนภายใต้ข้อจำกัดแบนด์วิดท์ของช่องสัญญาณมือถือดิจิทัลยุคแรก ตัวแปลงสัญญาณนี้ขับเคลื่อนไม่เพียงระบบโทรศัพท์ GSM เท่านั้น แต่ยังรวมถึงแอปพลิเคชัน VoIP ระบบวอยซ์เมล และแพลตฟอร์ม IVR จำนวนมากที่ได้ประโยชน์จากบิตเรตต่ำ ข้อดีที่โดดเด่นสามประการ ประการแรก การบีบอัดที่เหนือชั้น: เสียงพูดหนึ่งนาทีใช้พื้นที่เพียงประมาณ 100 KB ทำให้จัดเก็บและส่งข้อมูลได้อย่างมีประสิทธิภาพ ประการที่สอง เครื่องมือที่ใช้ได้ทั่วไป — ไลบรารีอย่าง libgsm และ SoX จัดการการเข้ารหัสและถอดรหัสบนทุกแพลตฟอร์มหลัก ประการที่สาม สิทธิบัตรที่ไม่มีค่าลิขสิทธิ์ซึ่งส่งเสริมการนำไปใช้ในโปรเจกต์โทรศัพท์โอเพนซอร์สอย่าง Asterisk และ FreeSWITCH
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ