ตัวแปลง AVI เป็น NIST

ดึงเสียงจากวิดีโอ AVI เป็นรูปแบบ NIST SPHERE ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ตามมาตรฐาน

เอาต์พุตเป็นไปตามข้อกำหนด NIST SPHERE อย่างแม่นยำ เสียง AVI ถูกบรรจุพร้อมส่วนหัวที่ถูกต้องสำหรับใช้โดยตรงในเวิร์กโฟลว์วิจัยด้านเสียงพูด

ไม่ต้องติดตั้งอะไร

แปลง AVI เป็น NIST ได้ในเบราว์เซอร์เลย — ไม่ต้องดาวน์โหลดชุดเครื่องมือ SPHERE แค่อัปโหลด แปลง แล้วรับไฟล์เสียงวิจัยของคุณ

จัดการข้อมูลอย่างปลอดภัย

วิดีโอ AVI ที่อัปโหลดจะถูกลบหลังแปลง ไฟล์เอาต์พุต NIST จะถูกลบภายใน 24 ชั่วโมง — ข้อมูลเสียงพูดของคุณเป็นความลับ

วิธีแปลง AVI เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

AVI (Audio Video Interleave) เป็นหนึ่งในรูปแบบคอนเทนเนอร์มัลติมีเดียที่เก่าแก่และเป็นที่รู้จักมากที่สุด เปิดตัวโดย Microsoft ในเดือนพฤศจิกายน 1992 เป็นส่วนหนึ่งของเทคโนโลยี Video for Windows สร้างบนโครงสร้าง Resource Interchange File Format (RIFF) โดย AVI จัดสลับข้อมูลเสียงและวิดีโอเป็นชิ้นส่วนสลับกัน ทำให้สามารถเล่นแบบซิงโครไนซ์ได้โดยไม่ต้องใช้การจัดการสตรีมที่ซับซ้อน รูปแบบนี้ไม่ขึ้นกับตัวแปลงสัญญาณ หมายความว่าสามารถเก็บวิดีโอที่บีบอัดด้วยตัวแปลงสัญญาณใดก็ได้ ตั้งแต่ Cinepak และ Indeo ในยุคแรกจนถึง DivX, Xvid และ H.264 ที่ทันสมัย ความยืดหยุ่นนี้ส่งผลให้ถูกนำมาใช้อย่างแพร่หลายทั่วคอมพิวเตอร์ส่วนบุคคลตลอดทศวรรษ 1990 และ 2000 คุณลักษณะที่โดดเด่นอย่างหนึ่งคือโครงสร้างภายในที่เข้าใจง่าย ทำให้ไฟล์ AVI แก้ไขและประมวลผลในระดับไบนารีได้ค่อนข้างง่ายเมื่อเทียบกับคอนเทนเนอร์สมัยใหม่ที่ซับซ้อนกว่า AVI ยังรองรับสตรีมเสียงหลายสตรีม ทำให้สามารถมีเนื้อหาหลายภาษาภายในไฟล์เดียว อย่างไรก็ตาม ข้อกำหนดดั้งเดิมมีข้อจำกัด ได้แก่ ขนาดไฟล์สูงสุด 2 GB ในรุ่นเก่า และไม่รองรับเฟรมเรตแบบผันแปรหรือรูปแบบคำบรรยายขั้นสูง ส่วนขยาย OpenDML (AVI 2.0) แก้ไขข้อจำกัดเรื่องขนาดโดยอนุญาตให้ไฟล์มีขนาดเกินขอบเขตเดิมได้ แม้จะมีอายุหลายทศวรรษ AVI ยังคงเป็นหนึ่งในรูปแบบมัลติมีเดียที่เป็นที่รู้จักอย่างกว้างขวางที่สุด และยังคงได้รับการรองรับจากเครื่องเล่นสื่อและเครื่องมือตัดต่อบนระบบปฏิบัติการหลักทุกระบบ
ผู้พัฒนา: Microsoft
เผยแพร่ครั้งแรก: 10 พฤศจิกายน 1992
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง AVI เป็น NIST?

NIST SPHERE เป็นรูปแบบมาตรฐานสำหรับชุดข้อมูลวิจัยด้านเสียงพูด การดึงเสียง AVI เป็น NIST ทำให้บทสนทนาจากวิดีโอใช้ได้ในระบบจดจำเสียง

อะไรอ่านไฟล์ NIST ได้?

ชุดเครื่องมือ NIST SPHERE, เฟรมเวิร์ก Kaldi ASR และ HTK รองรับเสียง NIST โดยตรง SOX ก็รองรับการอ่านและเขียนรูปแบบนี้

NIST ต่างจาก WAV อย่างไร?

NIST SPHERE มีข้อมูลเมตาส่วนหัวที่สมบูรณ์สำหรับการจัดการคลังข้อมูลเสียงพูดที่ WAV ไม่มี ทั้งคู่เก็บเสียง PCM แต่ NIST มุ่งเป้าไปที่ขั้นตอนวิจัย

คุณภาพเสียงคงอยู่ไหม?

NIST เก็บข้อมูล PCM โดยไม่บีบอัด ดังนั้นเสียงที่ดึงจาก AVI จะรักษาคุณภาพเต็มที่ ไม่มีการเข้ารหัสแบบสูญเสียระหว่างการแปลง

รองรับวิดีโอยาวๆ ได้ไหม?

เซิร์ฟเวอร์ของเราประมวลผลไฟล์ AVI ทุกความยาว วิดีโอยาวขึ้นใช้เวลามากขึ้นตามสัดส่วน แต่การแปลงยังคงเสถียรและเชื่อถือได้