ตัวแปลง TS เป็น HTK

แยกเสียง HTK Speech จากไฟล์ TS ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ผลลัพธ์เฉพาะทาง

HTK เป็นรูปแบบสำหรับการวิจัยการรู้จำเสียงพูด ดึงรูปแบบที่ต้องการจากแหล่ง TS

ประมวลผลบนคลาวด์

การแยกเสียงทำงานบนเซิร์ฟเวอร์ — ไม่ต้องใช้เครื่องมือพิเศษ

จัดการอย่างปลอดภัย

ไฟล์ TS จะถูกลบหลังแปลง ไฟล์ HTK จะถูกลบภายใน 24 ชั่วโมง

วิธีแปลง TS เป็น HTK

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ htk หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ htk ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

TS (MPEG Transport Stream) เป็นรูปแบบคอนเทนเนอร์มาตรฐานที่กำหนดเป็นส่วนหนึ่งของชั้นระบบ MPEG-2 (ISO/IEC 13818-1) ได้มาตรฐานโดย Moving Picture Experts Group ในปี 1995 Transport streams ออกแบบมาสำหรับสภาพแวดล้อมการสื่อสารและจัดเก็บที่อาจเกิดการสูญหายหรือเสียหายของข้อมูล เช่น โทรทัศน์ออกอากาศ การส่งผ่านดาวเทียม และการสตรีมผ่านเครือข่าย รูปแบบนี้แบ่งเนื้อหาเป็นแพ็กเก็ตขนาดคงที่ 188 ไบต์ แต่ละแพ็กเก็ตมี header 4 ไบต์ที่มีข้อมูลการซิงโครไนซ์ การบ่งชี้ข้อผิดพลาด และการระบุสตรีม โครงสร้างแพ็กเก็ตนี้ช่วยให้ตัวรับสัญญาณซิงโครไนซ์กลับคืนได้อย่างรวดเร็วหลังจากสัญญาณขัดจังหวะ ซึ่งเป็นความสามารถสำคัญสำหรับการส่งออกอากาศแบบเรียลไทม์ที่แยก transport streams จาก program streams ที่ออกแบบสำหรับสื่อจัดเก็บที่เชื่อถือได้ TS สามารถมัลติเพล็กซ์หลายโปรแกรมในสตรีมเดียว โดยมีตาราง Program Specific Information (PSI) ที่อธิบายโครงสร้างและเนื้อหาของแต่ละโปรแกรม รูปแบบรองรับตัวแปลงสัญญาณเสียงและวิดีโอแทบทุกชนิด แม้จะบรรจุ MPEG-2 video, H.264 หรือ HEVC ควบคู่กับ AAC, AC-3 หรือ MPEG audio เป็นหลัก TS เป็นแกนหลักของการส่งโทรทัศน์ดิจิทัลทั่วโลก ถูกใช้โดยมาตรฐานการออกอากาศ DVB, ATSC และ ISDB รวมถึงบริการสตรีมมิง IPTV และ OTT ที่ใช้ HTTP Live Streaming (HLS) ความทนทาน โครงสร้างที่เป็นมาตรฐาน และการรองรับตัวแปลงสัญญาณอย่างกว้างขวางทำให้ TS เหมาะสมทั้งในระบบออกอากาศสดและขั้นตอนการบันทึกแบบไฟล์
ผู้พัฒนา: Moving Picture Experts Group
เผยแพร่ครั้งแรก: 1995
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
เผยแพร่ครั้งแรก: 1993

คำถามที่พบบ่อย

ทำไมต้องแปลง TS เป็น HTK?

HTK เป็นรูปแบบสำหรับการวิจัยการรู้จำเสียงพูด การแปลงจะดึงเสียงจากไฟล์ TS ออกมา

ซอฟต์แวร์อะไรเปิด HTK ได้?

เครื่องมือเสียงเฉพาะทาง SoX และแอปพลิเคชันเฉพาะรูปแบบจัดการไฟล์ HTK ได้

HTK รองรับทั่วไปไหม?

HTK ใช้ในงานเฉพาะทาง สำหรับเสียงทั่วไป MP3, WAV หรือ FLAC เข้ากันได้กว้างกว่า

ปรับตั้งค่าได้ไหม?

ได้ — กำหนดอัตราสุ่มตัวอย่างและพารามิเตอร์ก่อนแปลง

แปลงเป็นชุดได้ไหม?

อัปโหลดไฟล์ TS หลายไฟล์และแยก HTK จากแต่ละไฟล์ได้พร้อมกัน