เครื่องมือแปลงไฟล์ AMB เป็น HTK

แปลงไฟล์ amb ของคุณให้เป็น htk ผ่านช่องทางออนไลน์ฟรี

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิธีแปลง AMB เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

ไฟล์ AMB บรรจุเสียงที่เข้ารหัสในรูปแบบ Ambisonic B-format ซึ่งเป็นเทคนิคเสียงเซอร์ราวด์แบบทรงกลมเต็มรูปแบบที่คิดค้นโดย Michael Gerzon ในช่วงทศวรรษ 1970 ต่างจากระบบแบบแชนเนลเช่น 5.1 หรือ 7.1 Ambisonics จับสนามเสียงสามมิติอย่างสมบูรณ์โดยใช้ spherical harmonics — B-format อันดับแรกประกอบด้วยสี่แชนเนล: W (รอบทิศทาง), X (หน้า-หลัง), Y (ซ้าย-ขวา) และ Z (บน-ล่าง) การแสดงผลนี้ไม่ขึ้นกับลำโพง หมายความว่าการบันทึกหนึ่งรายการสามารถถอดรหัสไปยังลำโพงรูปแบบใดก็ได้หรือหูฟังแบบ binaural โดยไม่ต้องมิกซ์ใหม่ ไฟล์ AMB มักเก็บข้อมูล PCM แบบไม่บีบอัดและประมวลผลด้วยเครื่องมืออย่าง SoX หรือปลั๊กอินเฉพาะทาง ข้อดีหลักคือความยืดหยุ่นเชิงพื้นที่ — ผู้สร้างสามารถผลิตไฟล์ต้นฉบับเดียวที่ปรับตัวเข้ากับการเล่นแบบสเตอริโอ เซอร์ราวด์ หรือเสียงแบบดื่มด่ำ รูปแบบยังปรับขนาดได้อย่างสง่างาม: Ambisonics อันดับสูงเพิ่มแชนเนลเพื่อเพิ่มความแม่นยำเชิงพื้นที่บนกรอบทางคณิตศาสตร์เดียวกัน ด้วยการเติบโตของความเป็นจริงเสมือน วิดีโอ 360 องศา และเสียงเชิงพื้นที่สำหรับเกม Ambisonics ได้รับความนิยมอีกครั้ง โดยถูกนำมาใช้โดยแพลตฟอร์มอย่าง YouTube สำหรับการส่งมอบสื่อแบบดื่มด่ำ
ผู้พัฒนา: Michael Gerzon / Ambisonic Community
เผยแพร่ครั้งแรก: 1975
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993