ตัวแปลง F4V เป็น NIST

ดึงเสียง NIST SPHERE จากวิดีโอ F4V Flash

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ตามมาตรฐานรัฐบาล

รูปแบบ NIST เป็นไปตามมาตรฐานงานวิจัยของรัฐบาล ดึงเสียง F4V สำหรับการประเมินเสียงพูดอย่างเป็นทางการ

วิจัยเสียงพูด

NIST จาก F4V ใช้งานได้โดยตรงในไปป์ไลน์วิจัยการรู้จำเสียงพูดและเครื่องมือวิเคราะห์ภาษาศาสตร์

ประมวลผลออนไลน์

การดึง NIST จาก F4V ทำงานบนคลาวด์ — ไม่ต้องติดตั้งซอฟต์แวร์วิจัยบนเครื่อง

วิธีแปลง F4V เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

F4V เป็นรูปแบบคอนเทนเนอร์มัลติมีเดียที่พัฒนาโดย Adobe Systems ในฐานะวิวัฒนาการของระบบนิเวศ Flash Video เปิดตัวในเดือนธันวาคม 2007 พร้อมกับ Flash Player 9 Update 3 โดย F4V อิงตาม ISO base media file format (MPEG-4 Part 14) และสร้างขึ้นเพื่อรองรับตัวแปลงสัญญาณวิดีโอ H.264 และเสียง AAC ภายในแพลตฟอร์ม Adobe Flash ต่างจากรุ่นก่อนหน้าอย่าง FLV ที่ใช้โครงสร้างคอนเทนเนอร์เฉพาะ F4V ใช้สถาปัตยกรรม atom/box แบบมาตรฐานที่เข้ากันได้กับ MP4 ทำให้ทำงานร่วมกับเครื่องมือและขั้นตอนการทำงานสื่ออื่นๆ ได้ดียิ่งขึ้น รูปแบบนี้รองรับฟีเจอร์ขั้นสูง ได้แก่ การเข้ารหัส H.264 แบบ high-profile เสียง AAC หลายช่อง และข้อความแบบกำหนดเวลาสำหรับคำบรรยาย F4V เป็นการเคลื่อนไหวเชิงกลยุทธ์เพื่อตอบสนองต่อความต้องการเนื้อหา H.264 บนเว็บที่เพิ่มขึ้น เนื่องจากคอนเทนเนอร์ FLV รุ่นเก่าไม่สามารถบรรจุตัวแปลงสัญญาณใหม่นี้ได้อย่างมีประสิทธิภาพ ในช่วงที่รุ่งเรืองที่สุด F4V ขับเคลื่อนเนื้อหาวิดีโอคุณภาพสูงส่วนใหญ่ที่ส่งผ่านแพลตฟอร์มสตรีมมิงและเครื่องเล่นวิดีโอบนเว็บที่ใช้ Flash คอนเทนเนอร์รองรับทั้งการดาวน์โหลดแบบ progressive และการสตรีมแบบ dynamic ให้ผู้เผยแพร่เนื้อหามีตัวเลือกการจัดจำหน่ายที่ยืดหยุ่น แม้ว่าการถดถอยของ Flash Player ที่หันไปใช้วิดีโอ HTML5 ได้ลดการสร้างเนื้อหา F4V ใหม่ แต่โครงสร้างที่อิง MP4 หมายความว่าสตรีมสื่อที่อยู่ภายในสามารถเข้าถึงได้ง่ายผ่านเครื่องมือสมัยใหม่
ผู้พัฒนา: Adobe Systems
เผยแพร่ครั้งแรก: 3 ธันวาคม 2007
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง F4V เป็น NIST?

รูปแบบ NIST ใช้ในงานวิจัยเสียงพูดของรัฐบาล ดึงเสียง F4V สำหรับการวิเคราะห์ภาษาศาสตร์ตามมาตรฐาน

NIST เหมือน SPH ไหม?

NIST และ SPH ต่างหมายถึงรูปแบบ SPHERE จาก National Institute of Standards and Technology — เป็นรูปแบบเดียวกัน

เครื่องมืออะไรอ่าน NIST ได้?

SOX, Kaldi, HTK toolkit และเครื่องมือประเมินเสียงพูดของ NIST สามารถอ่านรูปแบบ NIST ได้

ใช้อัตราสุ่มตัวอย่างเท่าไหร่?

ข้อมูลเสียงพูด NIST มักใช้ 8 kHz หรือ 16 kHz ขึ้นอยู่กับสภาพการบันทึก

แปลงเป็นชุดได้ไหม?

อัปโหลดไฟล์ F4V หลายไฟล์แล้วดึงเสียง NIST จากแต่ละไฟล์พร้อมกัน