ตัวแปลง OGV เป็น HTK

ดึงข้อมูลเสียงพูด HTK จากวิดีโอ Ogg

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

เอาต์พุตเฉพาะทาง

HTK รองรับการวิจัยการรู้จำเสียง ดึงเสียง OGV เป็นรูปแบบที่ระบบเป้าหมายต้องการ

แปลงบนคลาวด์

การดึง HTK จาก OGV ทำงานบนเซิร์ฟเวอร์ — ไม่ต้องติดตั้งซอฟต์แวร์เฉพาะบนคอมพิวเตอร์

ประมวลผลอย่างปลอดภัย

OGV ที่อัปโหลดจะถูกลบหลังแปลง ส่วน HTK จะถูกลบจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง OGV เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

OGV (Ogg Video) เป็นรูปแบบมัลติมีเดียแบบเปิดที่รวมตัวแปลงสัญญาณวิดีโอ Theora กับคอนเทนเนอร์ Ogg ทั้งสองพัฒนาโดย Xiph.Org Foundation ในฐานะทางเลือกปลอดค่าลิขสิทธิ์แทนรูปแบบสื่อเฉพาะ Theora 1.0 ออกเวอร์ชันเสถียรในเดือนพฤศจิกายน 2008 แม้ว่าการพัฒนาจะดำเนินมาตั้งแต่ปี 2002 โดยอิงจากตัวแปลงสัญญาณ VP3 ที่บริจาคโดย On2 Technologies Theora บีบอัดวิดีโอโดยใช้ motion compensation แบบบล็อกร่วมกับ discrete cosine transform coding ให้คุณภาพเทียบเคียง MPEG-4 Part 2 ที่บิตเรตใกล้เคียงกัน คอนเทนเนอร์ Ogg ใช้โครงร่างการมัลติเพล็กซ์แบบเพจที่สลับวิดีโอ Theora กับเสียง Vorbis หรือ Opus รองรับฟีเจอร์อย่าง chained streams สำหรับการต่อแบบไร้รอยต่อและสตรีมที่มัลติเพล็กซ์สำหรับการเล่นมัลติมีเดียที่ซิงโครไนซ์กัน OGV มีความสำคัญทางประวัติศาสตร์ในการผลักดันมาตรฐานเว็บเปิด โดยเป็นหนึ่งในรูปแบบวิดีโอแรกๆ ที่สามารถนำไปใช้ได้อย่างเสรีสำหรับองค์ประกอบวิดีโอ HTML5 Firefox และ Chrome ต่างรองรับ OGV โดยตรงในตัว แสดงให้เห็นว่าวิดีโอบนเว็บสามารถทำงานได้โดยไม่ต้องพึ่งพาปลั๊กอินเฉพาะหรือตัวแปลงสัญญาณที่มีลิขสิทธิ์ รูปแบบนี้ยังรองรับเสียง FLAC แบบ lossless, สตรีมคำบรรยาย Kate และเมตาดาต้า Skeleton ภายในคอนเทนเนอร์ Ogg แม้ว่า WebM และ AV1 จะเข้ามาแทนที่ OGV ในภูมิทัศน์วิดีโอโอเพนซอร์สเป็นส่วนใหญ่แล้ว แต่รูปแบบนี้ยังคงมีอยู่ในลินุกซ์ดิสทริบิวชัน เครื่องมือสื่อโอเพนซอร์ส และบริบทที่ต้องการอิสระจากข้อกังวลเรื่องสิทธิบัตรอย่างสมบูรณ์
ผู้พัฒนา: Xiph.Org Foundation
เผยแพร่ครั้งแรก: 3 พฤศจิกายน 2008
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

ทำไมต้องแปลง OGV เป็น HTK?

HTK ออกแบบมาสำหรับการวิจัยการรู้จำเสียง ดึงเสียง OGV เป็นรูปแบบเฉพาะทางสำหรับการใช้งานที่ต้องการ

โปรแกรมอะไรใช้ HTK?

แอปพลิเคชันและระบบสำหรับการวิจัยการรู้จำเสียงรับ HTK เป็นรูปแบบเสียงหลัก

HTK รองรับกว้างไหม?

HTK เป็นรูปแบบเฉพาะทาง SOX และเครื่องมือเฉพาะรองรับ แต่โปรแกรมเล่นทั่วไปอาจไม่รองรับ

คุณภาพเสียงดีไหม?

คุณภาพ HTK เหมาะกับจุดประสงค์ — แอปพลิเคชันวิจัยการรู้จำเสียงทำงานได้ดีกับรูปแบบนี้

แปลงเป็นชุดได้ไหม?

อัปโหลด OGV หลายรายการแล้วดึง HTK จากแต่ละไฟล์พร้อมกัน