ตัวแปลง MXF เป็น SPH

ดึงข้อมูลเสียงพูด NIST SPH จากไฟล์ MXF

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

มาตรฐานวิจัย

SPH เป็นมาตรฐาน NIST สำหรับวิจัยเสียงพูด ดึงเสียง MXF สำหรับวิเคราะห์ภาษาศาสตร์

Metadata หลากหลาย

รูปแบบ SPHERE มี metadata การบันทึกอย่างละเอียด — บริบทที่มีค่าจากแหล่ง MXF

ดึงบนคลาวด์

การดึง SPH จาก MXF ทำงานบนเซิร์ฟเวอร์ — ไม่ต้องมีเครื่องมือ NIST บนเครื่อง

วิธีแปลง MXF เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

MXF (Material Exchange Format) เป็นคอนเทนเนอร์สื่อระดับมืออาชีพที่ได้มาตรฐานโดย Society of Motion Picture and Television Engineers (SMPTE) ในปี 2004 ภายใต้ข้อกำหนด SMPTE 377M ออกแบบมาสำหรับอุตสาหกรรมการออกอากาศและหลังการผลิต โดย MXF เป็นตัวห่อหุ้มที่เป็นกลางต่อผู้ผลิตสำหรับบรรจุวิดีโอ เสียง และเมตาดาต้าเชิงพรรณนาที่หลากหลายระหว่างระบบและแพลตฟอร์มการผลิตต่างๆ รูปแบบนี้รองรับตัวแปลงสัญญาณระดับมืออาชีพหลากหลาย ได้แก่ MPEG-2, AVC-Intra, DNxHD, DNxHR, ProRes และ JPEG 2000 ทำให้ปรับตัวได้กับระดับคุณภาพต่างๆ ตั้งแต่การตัดต่อแบบ proxy จนถึงเก็บถาวรคุณภาพมาสเตอร์ กรอบเมตาดาต้าที่ครอบคลุมเป็นหนึ่งในคุณลักษณะเด่นของ MXF โดยบรรจุข้อมูลการผลิต เช่น ไทม์โค้ด ชื่อคลิป ตัวบ่งชี้เชิงพรรณนา การอ้างอิงแหล่ง และพารามิเตอร์ทางเทคนิคภายในโครงร่างการเข้ารหัส Key-Length-Value (KLV) ที่มีโครงสร้าง เมตาดาต้านี้เดินทางไปพร้อมกับเนื้อหาตลอดห่วงโซ่การผลิต ลดความเสี่ยงของการสูญเสียข้อมูลเมื่อไฟล์เคลื่อนย้ายระหว่างระบบนำเข้า ตัดต่อ กราฟิก ออกอากาศ และเก็บถาวร ไฟล์ MXF ใช้ระบบ operational pattern ที่กำหนดระดับความซับซ้อนต่างๆ ตั้งแต่แพ็กเกจรายการเดียวอย่างง่าย (OP1a) จนถึงเพลย์ลิสต์หลายรายการที่ซับซ้อน ผู้ผลิตอุปกรณ์ออกอากาศรายใหญ่และระบบขั้นตอนการทำงานแบบไฟล์รองรับ MXF ทุกค่าย และทำหน้าที่เป็นรูปแบบแลกเปลี่ยนสำหรับมาตรฐาน เช่น AS-02 และ AS-11 ที่ใช้ในการออกอากาศ
เผยแพร่ครั้งแรก: 2004
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง MXF เป็น SPH?

SPHERE (SPH) เป็นรูปแบบเสียงมาตรฐานสำหรับวิจัยเสียงพูดของ NIST — จำเป็นสำหรับคลังข้อมูลภาษาศาสตร์

อะไรใช้ไฟล์ SPH?

แคมเปญประเมินเสียงพูดของ NIST, คลังข้อมูล Linguistic Data Consortium และงานวิจัยการรู้จำเสียงพูดใช้ SPH

SPH ใช้งานร่วมกันได้กว้างไหม?

SPH เฉพาะสำหรับวิจัยเสียงพูด SOX, เครื่องมือ NIST และ Kaldi รองรับไฟล์ SPH

SPH มี metadata อะไรบ้าง?

ส่วนหัว SPHERE มี metadata เกี่ยวกับสภาพการบันทึก ข้อมูลผู้พูด และรายละเอียดแชนเนล

แปลงเป็นชุดได้ไหม?

อัปโหลดไฟล์ MXF หลายไฟล์แล้วดึงเสียง SPH พร้อมกันสำหรับสร้างคลังเสียงพูด