เครื่องมือแปลงไฟล์ HTK เป็น MP2

แปลงไฟล์ htk ของคุณให้เป็น mp2 ผ่านช่องทางออนไลน์ฟรี

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง

การตั้งค่า

ตั้งค่าบิตเรตเสียงขาออกโดยรวมสำหรับ MP2 หากตั้งค่าเป็น "กำหนดเอง" ช่วงที่แนะนำคือ ≥320 kbps โดยมีค่าสูงสุดอยู่ที่ 384 kbps
กำหนดจำนวนช่องสัญญาณเสียง การตั้งค่านี้มีประโยชน์มากที่สุดเมื่อทำการลด (ดาวน์มิกซ์) ช่องสัญญาณ (เช่น จาก 5.1 เป็นสเตอริโอ)
กำหนดอัตราตัวอย่างของเสียง เพลงที่มีคลื่นความถี่เต็มที่ (20 Hz - 20 kHz) ต้องมีค่าไม่ต่ำกว่า 44.1 kHz เพื่อให้เกิดความโปร่งใส สามารถอ่านข้อมูลเพิ่มเติมได้ใน วิกิ

htk

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
อ่านเพิ่มเติม

mp2

MP2 (MPEG-1 Audio Layer II) หรือที่รู้จักในชื่อโปรเจกต์ดั้งเดิม MUSICAM เป็นตัวแปลงสัญญาณเสียงเชิงรับรู้ที่ได้รับมาตรฐานเป็นส่วนหนึ่งของ ISO/IEC 11172-3 ในปี 1993 ในขณะที่ MP3 ซึ่งเป็นรุ่นถัดมาได้รับความสนใจจากผู้บริโภค MP2 ได้สร้างตำแหน่งที่มั่นคงในวงการออกอากาศมืออาชีพที่ยังคงรักษาอยู่จนถึงทุกวันนี้ ตัวแปลงสัญญาณแบ่งเสียงออกเป็น 32 ซับแบนด์ผ่าน polyphase filter bank ใช้แบบจำลองจิตอะคูสติกเพื่อกำหนดเกณฑ์การปกปิด จากนั้นควอนไทซ์และเข้ารหัส Huffman แต่ละซับแบนด์ตามนั้น การใช้งานออกอากาศทั่วไปใช้ 192-384 kbps สำหรับสเตอริโอ ให้คุณภาพโปร่งใสพร้อมความซับซ้อนตัวเข้ารหัสที่ต่ำกว่าและความทนทานต่อข้อผิดพลาดที่ดีกว่า Layer III คุณสมบัติเหล่านี้อธิบายได้ว่าทำไมโทรทัศน์ DVB วิทยุดิจิทัล DAB และมาตรฐานกล้อง HDV ล้วนกำหนดหรือเลือก MP2 เวลาแฝงของตัวเข้ารหัสก็สั้นกว่า ซึ่งเป็นคุณสมบัติสำคัญสำหรับการออกอากาศสดที่ต้องซิงค์ปากกับเสียง ข้อดีสามประการที่ทำให้ MP2 ยังคงมีความเกี่ยวข้องหลายทศวรรษหลังการกำหนดมาตรฐาน: การเสื่อมคุณภาพอย่างสง่างามภายใต้ข้อผิดพลาดในการส่งซึ่งสำคัญสำหรับสัญญาณออกอากาศทางอากาศ ความล่าช้าในการเข้ารหัสที่น้อยที่สุดเหมาะกับสายการออกอากาศแบบเรียลไทม์ และการยอมรับจากหน่วยงานกำกับดูแลที่ฝังลึกในกรอบการออกอากาศของยุโรปและเอเชีย
อ่านเพิ่มเติม
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิธีแปลง HTK เป็น MP2

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ mp2 หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ mp2 ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993
MP2 (MPEG-1 Audio Layer II) หรือที่รู้จักในชื่อโปรเจกต์ดั้งเดิม MUSICAM เป็นตัวแปลงสัญญาณเสียงเชิงรับรู้ที่ได้รับมาตรฐานเป็นส่วนหนึ่งของ ISO/IEC 11172-3 ในปี 1993 ในขณะที่ MP3 ซึ่งเป็นรุ่นถัดมาได้รับความสนใจจากผู้บริโภค MP2 ได้สร้างตำแหน่งที่มั่นคงในวงการออกอากาศมืออาชีพที่ยังคงรักษาอยู่จนถึงทุกวันนี้ ตัวแปลงสัญญาณแบ่งเสียงออกเป็น 32 ซับแบนด์ผ่าน polyphase filter bank ใช้แบบจำลองจิตอะคูสติกเพื่อกำหนดเกณฑ์การปกปิด จากนั้นควอนไทซ์และเข้ารหัส Huffman แต่ละซับแบนด์ตามนั้น การใช้งานออกอากาศทั่วไปใช้ 192-384 kbps สำหรับสเตอริโอ ให้คุณภาพโปร่งใสพร้อมความซับซ้อนตัวเข้ารหัสที่ต่ำกว่าและความทนทานต่อข้อผิดพลาดที่ดีกว่า Layer III คุณสมบัติเหล่านี้อธิบายได้ว่าทำไมโทรทัศน์ DVB วิทยุดิจิทัล DAB และมาตรฐานกล้อง HDV ล้วนกำหนดหรือเลือก MP2 เวลาแฝงของตัวเข้ารหัสก็สั้นกว่า ซึ่งเป็นคุณสมบัติสำคัญสำหรับการออกอากาศสดที่ต้องซิงค์ปากกับเสียง ข้อดีสามประการที่ทำให้ MP2 ยังคงมีความเกี่ยวข้องหลายทศวรรษหลังการกำหนดมาตรฐาน: การเสื่อมคุณภาพอย่างสง่างามภายใต้ข้อผิดพลาดในการส่งซึ่งสำคัญสำหรับสัญญาณออกอากาศทางอากาศ ความล่าช้าในการเข้ารหัสที่น้อยที่สุดเหมาะกับสายการออกอากาศแบบเรียลไทม์ และการยอมรับจากหน่วยงานกำกับดูแลที่ฝังลึกในกรอบการออกอากาศของยุโรปและเอเชีย
ผู้พัฒนา: Moving Picture Experts Group
เผยแพร่ครั้งแรก: 1993