ตัวแปลง F4V เป็น SPH

ดึงเสียง NIST SPHERE SPH จากวิดีโอ F4V Flash

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

มาตรฐานวิจัย

SPH เป็นมาตรฐาน NIST สำหรับวิจัยเสียงพูด ดึงเสียง F4V สำหรับวิเคราะห์ภาษาศาสตร์

Metadata หลากหลาย

รูปแบบ SPHERE มี metadata การบันทึกอย่างละเอียด — บริบทที่มีค่าจากแหล่ง F4V

ดึงบนคลาวด์

การดึง SPH จาก F4V ทำงานบนเซิร์ฟเวอร์ — ไม่ต้องมีเครื่องมือ NIST บนเครื่อง

วิธีแปลง F4V เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

F4V เป็นรูปแบบคอนเทนเนอร์มัลติมีเดียที่พัฒนาโดย Adobe Systems ในฐานะวิวัฒนาการของระบบนิเวศ Flash Video เปิดตัวในเดือนธันวาคม 2007 พร้อมกับ Flash Player 9 Update 3 โดย F4V อิงตาม ISO base media file format (MPEG-4 Part 14) และสร้างขึ้นเพื่อรองรับตัวแปลงสัญญาณวิดีโอ H.264 และเสียง AAC ภายในแพลตฟอร์ม Adobe Flash ต่างจากรุ่นก่อนหน้าอย่าง FLV ที่ใช้โครงสร้างคอนเทนเนอร์เฉพาะ F4V ใช้สถาปัตยกรรม atom/box แบบมาตรฐานที่เข้ากันได้กับ MP4 ทำให้ทำงานร่วมกับเครื่องมือและขั้นตอนการทำงานสื่ออื่นๆ ได้ดียิ่งขึ้น รูปแบบนี้รองรับฟีเจอร์ขั้นสูง ได้แก่ การเข้ารหัส H.264 แบบ high-profile เสียง AAC หลายช่อง และข้อความแบบกำหนดเวลาสำหรับคำบรรยาย F4V เป็นการเคลื่อนไหวเชิงกลยุทธ์เพื่อตอบสนองต่อความต้องการเนื้อหา H.264 บนเว็บที่เพิ่มขึ้น เนื่องจากคอนเทนเนอร์ FLV รุ่นเก่าไม่สามารถบรรจุตัวแปลงสัญญาณใหม่นี้ได้อย่างมีประสิทธิภาพ ในช่วงที่รุ่งเรืองที่สุด F4V ขับเคลื่อนเนื้อหาวิดีโอคุณภาพสูงส่วนใหญ่ที่ส่งผ่านแพลตฟอร์มสตรีมมิงและเครื่องเล่นวิดีโอบนเว็บที่ใช้ Flash คอนเทนเนอร์รองรับทั้งการดาวน์โหลดแบบ progressive และการสตรีมแบบ dynamic ให้ผู้เผยแพร่เนื้อหามีตัวเลือกการจัดจำหน่ายที่ยืดหยุ่น แม้ว่าการถดถอยของ Flash Player ที่หันไปใช้วิดีโอ HTML5 ได้ลดการสร้างเนื้อหา F4V ใหม่ แต่โครงสร้างที่อิง MP4 หมายความว่าสตรีมสื่อที่อยู่ภายในสามารถเข้าถึงได้ง่ายผ่านเครื่องมือสมัยใหม่
ผู้พัฒนา: Adobe Systems
เผยแพร่ครั้งแรก: 3 ธันวาคม 2007
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง F4V เป็น SPH?

SPHERE (SPH) เป็นรูปแบบเสียงมาตรฐานสำหรับวิจัยเสียงพูดของ NIST — จำเป็นสำหรับคลังข้อมูลภาษาศาสตร์

อะไรใช้ไฟล์ SPH?

แคมเปญประเมินเสียงพูดของ NIST, คลังข้อมูล Linguistic Data Consortium และงานวิจัยการรู้จำเสียงพูดใช้ SPH

SPH ใช้งานร่วมกันได้กว้างไหม?

SPH เฉพาะสำหรับวิจัยเสียงพูด SOX, เครื่องมือ NIST และ Kaldi รองรับไฟล์ SPH

SPH มี metadata อะไรบ้าง?

ส่วนหัว SPHERE มี metadata เกี่ยวกับสภาพการบันทึก ข้อมูลผู้พูด และรายละเอียดแชนเนล

แปลงเป็นชุดได้ไหม?

อัปโหลดไฟล์ F4V หลายไฟล์แล้วดึงเสียง SPH พร้อมกันสำหรับสร้างคลังเสียงพูด