MKV to NIST ตัวแปลงไฟล์

สกัด MKV audio as NIST SPHERE speech format ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

รูปแบบคุณภาพงานวิจัย

เอาต์พุต NIST SPHERE จากวิดีโอ MKV ตรงตามข้อกำหนดของ National Institute of Standards and Technology — เข้ากันได้กับเครื่องมือ ASR อย่างสมบูรณ์

MKV สู่ข้อมูลเสียงพูด

สกัดบทสนทนาจากคอนเทนเนอร์ MKV ที่มีฟีเจอร์มากมายและแพ็กเกจเป็น NIST — พร้อมสำหรับการฝึกและประเมินผลการจดจำเสียงพูด

จัดการอย่างปลอดภัย

ไฟล์ MKV ที่อัปโหลดจะถูกลบหลังการแปลง ไฟล์ NIST จะถูกลบภายใน 24 ชั่วโมง — ข้อมูลเสียงวิจัยของคุณยังคงเป็นส่วนตัว

วิธีแปลง MKV เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

MKV (Matroska Video) เป็นรูปแบบคอนเทนเนอร์มัลติมีเดียมาตรฐานเปิดที่พัฒนาโดยโครงการ Matroska ซึ่งประกาศเปิดตัวรูปแบบนี้ในเดือนธันวาคม 2002 ตั้งชื่อตามตุ๊กตาซ้อน matryoshka ของรัสเซีย รูปแบบสร้างบน Extensible Binary Meta Language (EBML) ซึ่งเป็นรูปแบบไบนารีที่ย่อส่วนจาก XML ที่ให้โครงสร้างที่ยืดหยุ่นและรองรับอนาคต MKV สามารถเก็บแทร็กวิดีโอ เสียง และคำบรรยายได้ไม่จำกัดจำนวนภายในไฟล์เดียว รองรับตัวแปลงสัญญาณตั้งแต่ H.264 และ HEVC ไปจนถึง VP9 และ AV1 สำหรับวิดีโอ และ AAC, FLAC, Opus และ DTS สำหรับเสียง จุดเด่นที่สำคัญคือการรองรับคำบรรยายอย่างครอบคลุม จัดการได้ตั้งแต่ข้อความ SRT แบบง่ายไปจนถึงคำบรรยาย ASS แบบมีสไตล์ที่ซับซ้อน และแทร็ก PGS แบบบิตแมปจากแผ่น Blu-ray MKV ยังรองรับตัวบ่งชี้บท ไฟล์แนบ (เช่น ฟอนต์ที่จำเป็นสำหรับคำบรรยายแบบมีสไตล์) และเมตาดาต้าแท็ก ทำให้เป็นคอนเทนเนอร์ที่มีฟีเจอร์มากที่สุดแห่งหนึ่ง ข้อกำหนดแบบเปิดทำให้นักพัฒนาใดก็ได้สามารถใช้งานการอ่านและเขียน MKV ได้โดยไม่มีค่าธรรมเนียมการอนุญาต ซึ่งผลักดันให้มีการนำไปใช้อย่างกว้างขวางในเครื่องเล่นสื่อ เครื่องมือสตรีมมิง และซอฟต์แวร์เข้ารหัส ความสามารถในการรวมตัวแปลงสัญญาณผสมใดก็ได้ในไฟล์เดียวที่จัดระเบียบดี ทำให้ MKV เป็นคอนเทนเนอร์ที่ได้รับความนิยมสูงสุดสำหรับการเผยแพร่วิดีโอคุณภาพสูง การเก็บถาวร และคลังสื่อส่วนตัว
ผู้พัฒนา: Matroska
เผยแพร่ครั้งแรก: 6 ธันวาคม 2002
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง MKV เป็น NIST?

NIST SPHERE เป็นมาตรฐานสำหรับเสียงวิจัยเสียงพูด วิดีโอ MKV ที่มีบทสนทนากลายเป็นข้อมูลที่มีโครงสร้างสำหรับฝึกระบบ ASR

เฟรมเวิร์กอะไรอ่าน NIST?

Kaldi, HTK, Praat และชุดเครื่องมือ NIST SPHERE รองรับรูปแบบนี้โดยตรง เป็นมาตรฐานทองคำสำหรับการแจกจ่ายเสียงพูด

หลายแทร็กใน MKV ทำงานได้ไหม?

MKV สามารถมีแทร็กเสียงหลายแทร็ก สตรีมเสียงหลักจะถูกสกัดและเข้ารหัสเป็นรูปแบบ NIST ระหว่างการแปลง

คุณภาพเสียงถูกรักษาไว้ไหม?

NIST เก็บ PCM โดยไม่บีบอัด เสียงที่สกัดจาก MKV รักษาคุณภาพเต็ม — เหมาะสำหรับการวิเคราะห์และสร้างโมเดลเสียงพูดอย่างแม่นยำ

NIST เปรียบเทียบกับ WAV อย่างไร?

NIST SPHERE เพิ่มเมตาดาต้าคลังเสียงพูดที่ WAV ไม่มี ทั้งสองเก็บเสียง PCM แต่ NIST เป็นที่นิยมในงานวิจัยสำหรับส่วนหัวที่มีโครงสร้าง

แปลง MKV เป็นกลุ่มได้ไหม?

อัปโหลดไฟล์ MKV หลายไฟล์และแปลงทั้งหมดเป็น NIST พร้อมกัน เหมาะสำหรับสร้างชุดข้อมูลเสียงพูดจากคอลเลกชันวิดีโอ