เครื่องมือแปลงไฟล์ NIST เป็น OPUS
แปลงไฟล์ nist ของคุณให้เป็น opus ผ่านช่องทางออนไลน์ฟรี
nist
opus
การตั้งค่า
อัตโนมัติ
ตั้งค่าบิตเรตเสียง Opus ต่อช่อง หากตั้งค่าเป็น "กำหนดเอง" ตัวแปลงสัญญาณเสียง Opus จะรองรับได้สูงสุด 256 kbit/s ต่อช่องสัญญาณ โดยมีช่วงที่แนะนำอยู่ที่ ≥64 kbps
อัตโนมัติ (ไม่มีการเปลี่ยนแปลง)
กำหนดจำนวนช่องสัญญาณเสียง การตั้งค่านี้มีประโยชน์มากที่สุดเมื่อทำการลด (ดาวน์มิกซ์) ช่องสัญญาณ (เช่น จาก 5.1 เป็นสเตอริโอ)
อัตโนมัติ (ไม่มีการเปลี่ยนแปลง)
กำหนดอัตราตัวอย่างของเสียง เพลงที่มีคลื่นความถี่เต็มที่ (20 Hz - 20 kHz) ต้องมีค่าไม่ต่ำกว่า 44.1 kHz เพื่อให้เกิดความโปร่งใส สามารถอ่านข้อมูลเพิ่มเติมได้ใน วิกิ
nist
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
อ่านเพิ่มเติม
opus
Opus เป็นโคเดกเสียงแบบเปิดที่หลากหลาย ได้รับการกำหนดมาตรฐานโดย IETF ตาม RFC 6716 ในปี 2012 โดยผสมผสานสองแนวทางการเข้ารหัส — SILK สำหรับเสียงพูดและ CELT สำหรับดนตรี — เข้าเป็นอัลกอริทึมเดียวที่ผสานระหว่างสองแบบตามประเภทเนื้อหาและบิตเรต การออกแบบแบบไฮบริดนี้ทำให้ Opus มีประสิทธิภาพเหนือโคเดกอื่นเกือบทั้งหมดในการใช้งานหลากหลายรูปแบบ ตั้งแต่เสียงพูดที่มีเวลาแฝงต่ำที่ 6 kbps ไปจนถึงดนตรีคุณภาพสูงที่ 128 kbps และทุกอย่างที่อยู่ระหว่างนั้น รองรับบิตเรตตั้งแต่ 6 ถึง 510 kbps อัตราสุ่มตัวอย่างสูงสุด 48 kHz และขนาดเฟรมเล็กสุดเพียง 2.5 ms ทำให้มีเวลาแฝงเชิงอัลกอริทึมต่ำที่สุดในบรรดาโคเดกเสียงกระแสหลัก Opus มีข้อดีที่น่าสนใจสามประการ — ปลอดค่าลิขสิทธิ์และเป็นโอเพนซอร์สอย่างสมบูรณ์ ซึ่งขจัดอุปสรรคด้านการอนุญาตที่ขัดขวางโคเดกที่เป็นกรรมสิทธิ์ นอกจากนี้ยังบรรลุคุณภาพที่โปร่งใสที่บิตเรตประมาณครึ่งหนึ่งของ MP3 และเอาชนะ AAC ที่อัตราเทียบเท่า และเวลาแฝงต่ำทำให้เป็นโคเดกบังคับสำหรับ WebRTC ดังนั้นเบราว์เซอร์สมัยใหม่ทุกตัวจึงมาพร้อมตัวถอดรหัส Opus WhatsApp, Discord, Zoom และ YouTube ทั้งหมดใช้ Opus สำหรับเสียงแบบเรียลไทม์
อ่านเพิ่มเติม
วิธีแปลง NIST เป็น OPUS
เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.
เลือกรูปแบบไฟล์ opus หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)
ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ opus ของคุณได้หลังจากนั้น
เกี่ยวกับรูปแบบไฟล์
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
Opus เป็นโคเดกเสียงแบบเปิดที่หลากหลาย ได้รับการกำหนดมาตรฐานโดย IETF ตาม RFC 6716 ในปี 2012 โดยผสมผสานสองแนวทางการเข้ารหัส — SILK สำหรับเสียงพูดและ CELT สำหรับดนตรี — เข้าเป็นอัลกอริทึมเดียวที่ผสานระหว่างสองแบบตามประเภทเนื้อหาและบิตเรต การออกแบบแบบไฮบริดนี้ทำให้ Opus มีประสิทธิภาพเหนือโคเดกอื่นเกือบทั้งหมดในการใช้งานหลากหลายรูปแบบ ตั้งแต่เสียงพูดที่มีเวลาแฝงต่ำที่ 6 kbps ไปจนถึงดนตรีคุณภาพสูงที่ 128 kbps และทุกอย่างที่อยู่ระหว่างนั้น รองรับบิตเรตตั้งแต่ 6 ถึง 510 kbps อัตราสุ่มตัวอย่างสูงสุด 48 kHz และขนาดเฟรมเล็กสุดเพียง 2.5 ms ทำให้มีเวลาแฝงเชิงอัลกอริทึมต่ำที่สุดในบรรดาโคเดกเสียงกระแสหลัก Opus มีข้อดีที่น่าสนใจสามประการ — ปลอดค่าลิขสิทธิ์และเป็นโอเพนซอร์สอย่างสมบูรณ์ ซึ่งขจัดอุปสรรคด้านการอนุญาตที่ขัดขวางโคเดกที่เป็นกรรมสิทธิ์ นอกจากนี้ยังบรรลุคุณภาพที่โปร่งใสที่บิตเรตประมาณครึ่งหนึ่งของ MP3 และเอาชนะ AAC ที่อัตราเทียบเท่า และเวลาแฝงต่ำทำให้เป็นโคเดกบังคับสำหรับ WebRTC ดังนั้นเบราว์เซอร์สมัยใหม่ทุกตัวจึงมาพร้อมตัวถอดรหัส Opus WhatsApp, Discord, Zoom และ YouTube ทั้งหมดใช้ Opus สำหรับเสียงแบบเรียลไทม์