ตัวแปลง M4V เป็น SPH

ดึงเสียง M4V เป็นรูปแบบ NIST SPHERE สำหรับงานวิจัยเสียงพูด

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิดีโอสู่ข้อมูลเสียงพูด

ดึงบทสนทนาจากวิดีโอ Apple M4V แล้วบรรจุเป็น NIST SPHERE — พร้อมสำหรับวิจัยการรู้จำเสียงและชุดข้อมูลฝึก

มาตรฐาน NIST

ผลลัพธ์ SPH เป็นไปตามข้อกำหนด SPHERE ทุกประการ เข้ากันได้กับเฟรมเวิร์กการรู้จำเสียงหลักทั้งหมดในงานวิจัย

ทุกแพลตฟอร์ม

แปลง M4V เป็น SPH จากอุปกรณ์ใดก็ได้ที่มีเบราว์เซอร์ — Windows, Mac, Linux หรือมือถือ ไม่ต้องมีเครื่องมือเฉพาะแพลตฟอร์ม

วิธีแปลง M4V เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

M4V เป็นรูปแบบคอนเทนเนอร์วิดีโอที่พัฒนาโดย Apple Inc. และเปิดตัวพร้อมกับ iTunes Video Store ในเดือนตุลาคม 2005 ในทางเทคนิค M4V แทบจะเหมือนกันกับรูปแบบ MP4 มาตรฐาน (MPEG-4 Part 14) โดยความแตกต่างหลักคือการป้องกัน DRM FairPlay ที่เป็นทางเลือกซึ่งใช้กับเนื้อหาที่ซื้อจาก iTunes Store ไฟล์ M4V ที่ไม่มีการป้องกันเข้ากันได้อย่างสมบูรณ์กับเครื่องเล่นใดก็ได้ที่รองรับ MP4 เนื่องจากโครงสร้างคอนเทนเนอร์พื้นฐานและการรองรับตัวแปลงสัญญาณเหมือนกัน รูปแบบนี้มักมีวิดีโอ H.264 และเสียง AAC รองรับความละเอียดสูงสุดถึง 4K พร้อมฟีเจอร์อย่างตัวบ่งชี้บท แทร็กคำบรรยาย และแท็กเมตาดาต้าสำหรับชื่อ ปกอาร์ตเวิร์ก และเรตติ้ง Apple เลือกนามสกุล M4V เพื่อแยกเนื้อหา iTunes จากไฟล์ MP4 ทั่วไป โดยหลักเพื่อให้สิ่งที่ซื้อพร้อมการป้องกัน DRM ถูกจดจำโดยระบบนิเวศของ Apple ไฟล์ M4V เล่นได้โดยตรงบน macOS, iOS, iPadOS และ Apple TV และเวอร์ชันที่ไม่มีการป้องกันทำงานได้อย่างราบรื่นบนเครื่องเล่นสื่อหลักส่วนใหญ่บนทุกแพลตฟอร์ม รูปแบบนี้ได้รับความนิยมอย่างมากเมื่อ iTunes Store กลายเป็นแพลตฟอร์มหลักสำหรับซื้อและเช่าภาพยนตร์ดิจิทัลและรายการทีวี ความเข้ากันได้กับระบบนิเวศ MP4 ที่กว้างกว่าหมายความว่าสตรีมวิดีโอและเสียงภายในไฟล์ M4V ที่ปราศจาก DRM สามารถประมวลผลได้โดยเครื่องมือตัดต่อหรือแปลงรหัสที่ทันสมัยแทบทุกตัวโดยไม่ต้องแปลง
ผู้พัฒนา: Apple Inc.
เผยแพร่ครั้งแรก: ตุลาคม 2005
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง M4V เป็น SPH?

SPH เป็นมาตรฐาน NIST สำหรับเสียงวิจัยเสียงพูด การดึงบทสนทนา M4V เป็น SPH ทำให้เนื้อหาวิดีโอ Apple ใช้ได้สำหรับฝึก ASR

เครื่องมือใดรองรับ SPH?

Kaldi, HTK, Praat และชุดเครื่องมือ NIST SPHERE ทำงานกับ SPH โดยตรง รูปแบบนี้เป็นมาตรฐานในสถาบันวิจัยเสียงพูด

SPH บีบอัดเสียงไหม?

ไม่ — SPH เก็บข้อมูล PCM โดยไม่บีบอัดแบบสูญเสีย เสียง M4V ถึงรูปแบบ SPHERE ด้วยคุณภาพเต็มสำหรับการวิเคราะห์ที่แม่นยำ

แปลง M4V ที่มีการป้องกันได้ไหม?

M4V ที่มี DRM จาก iTunes ไม่สามารถประมวลผลได้ ไฟล์ M4V ที่ไม่มีการป้องกัน — บันทึกหน้าจอ วิดีโอส่วนตัว — แปลงเป็น SPH ได้

รองรับประมวลผลหลายไฟล์ไหม?

ได้ — อัปโหลดไฟล์ M4V หลายไฟล์และแปลงเป็น SPH พร้อมกัน เหมาะสำหรับสร้างชุดข้อมูลเสียงพูดจากคอลเลกชันวิดีโอ