ตัวแปลง AVI เป็น HTK

แยกเสียง AVI เป็นรูปแบบ HTK สำหรับประมวลผลเสียงพูดออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

เสียง AVI สู่ HTK

แยกช่องสัญญาณเสียงจากวิดีโอ AVI แล้วแปลงเป็นรูปแบบ HTK — พร้อมสำหรับการรู้จำเสียงพูดและฝึกโมเดลอะคูสติก

แปลงบนคลาวด์

การแปลงทำงานทั้งหมดบนเซิร์ฟเวอร์ของเรา ปล่อยให้เครื่องของคุณว่าง อัปโหลด AVI ดาวน์โหลด HTK — ไม่ต้องใช้การประมวลผลหนักในเครื่อง

เป็นส่วนตัวและปลอดภัย

ไฟล์ AVI ที่อัปโหลดจะถูกลบทันทีหลังแปลง เอาต์พุต HTK จะถูกลบภายใน 24 ชั่วโมงเพื่อปกป้องข้อมูลวิจัยของคุณ

วิธีแปลง AVI เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

AVI (Audio Video Interleave) เป็นหนึ่งในรูปแบบคอนเทนเนอร์มัลติมีเดียที่เก่าแก่และเป็นที่รู้จักมากที่สุด เปิดตัวโดย Microsoft ในเดือนพฤศจิกายน 1992 เป็นส่วนหนึ่งของเทคโนโลยี Video for Windows สร้างบนโครงสร้าง Resource Interchange File Format (RIFF) โดย AVI จัดสลับข้อมูลเสียงและวิดีโอเป็นชิ้นส่วนสลับกัน ทำให้สามารถเล่นแบบซิงโครไนซ์ได้โดยไม่ต้องใช้การจัดการสตรีมที่ซับซ้อน รูปแบบนี้ไม่ขึ้นกับตัวแปลงสัญญาณ หมายความว่าสามารถเก็บวิดีโอที่บีบอัดด้วยตัวแปลงสัญญาณใดก็ได้ ตั้งแต่ Cinepak และ Indeo ในยุคแรกจนถึง DivX, Xvid และ H.264 ที่ทันสมัย ความยืดหยุ่นนี้ส่งผลให้ถูกนำมาใช้อย่างแพร่หลายทั่วคอมพิวเตอร์ส่วนบุคคลตลอดทศวรรษ 1990 และ 2000 คุณลักษณะที่โดดเด่นอย่างหนึ่งคือโครงสร้างภายในที่เข้าใจง่าย ทำให้ไฟล์ AVI แก้ไขและประมวลผลในระดับไบนารีได้ค่อนข้างง่ายเมื่อเทียบกับคอนเทนเนอร์สมัยใหม่ที่ซับซ้อนกว่า AVI ยังรองรับสตรีมเสียงหลายสตรีม ทำให้สามารถมีเนื้อหาหลายภาษาภายในไฟล์เดียว อย่างไรก็ตาม ข้อกำหนดดั้งเดิมมีข้อจำกัด ได้แก่ ขนาดไฟล์สูงสุด 2 GB ในรุ่นเก่า และไม่รองรับเฟรมเรตแบบผันแปรหรือรูปแบบคำบรรยายขั้นสูง ส่วนขยาย OpenDML (AVI 2.0) แก้ไขข้อจำกัดเรื่องขนาดโดยอนุญาตให้ไฟล์มีขนาดเกินขอบเขตเดิมได้ แม้จะมีอายุหลายทศวรรษ AVI ยังคงเป็นหนึ่งในรูปแบบมัลติมีเดียที่เป็นที่รู้จักอย่างกว้างขวางที่สุด และยังคงได้รับการรองรับจากเครื่องเล่นสื่อและเครื่องมือตัดต่อบนระบบปฏิบัติการหลักทุกระบบ
ผู้พัฒนา: Microsoft
เผยแพร่ครั้งแรก: 10 พฤศจิกายน 1992
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

ทำไมต้องแปลง AVI เป็น HTK?

HTK จำเป็นสำหรับงานวิจัยประมวลผลเสียงพูดที่ใช้ Hidden Markov Model Toolkit การแยกเสียง AVI เป็น HTK ป้อนตรงเข้าสู่เวิร์กโฟลว์การรู้จำเสียง

ซอฟต์แวร์ใดอ่านเสียง HTK?

ชุดเครื่องมือ HTK Toolkit อ่านไฟล์ HTK โดยกำเนิด CSound และเครื่องมือวิเคราะห์เสียงพูดทางวิชาการต่างๆ ก็รองรับรูปแบบ PCM 16 บิตนี้

HTK เหมาะสำหรับเพลงไหม?

HTK ออกแบบมาสำหรับการวิเคราะห์เสียงพูด ไม่ใช่เพลง เก็บเสียง PCM 16 บิตช่องสัญญาณเดียวที่ปรับให้เหมาะกับไปป์ไลน์ประมวลผล Hidden Markov Model

การแปลงรักษาความชัดเจนของเสียงพูดไหม?

แทร็กเสียงถูกแยกจากไฟล์ AVI ต้นฉบับอย่างถูกต้อง HTK เก็บข้อมูล PCM แบบไม่บีบอัด ดังนั้นเนื้อหาเสียงพูดยังคงชัดเจนเต็มที่

แปลงไฟล์ AVI หลายไฟล์พร้อมกันได้ไหม?

ได้ — อัปโหลดไฟล์ AVI หลายไฟล์พร้อมกันแล้วแปลงทั้งหมดเป็นรูปแบบ HTK ช่วยเร่งการเตรียมชุดข้อมูลสำหรับโปรเจกต์วิจัยเสียงพูด