ตัวแปลง AAC เป็น NIST

แปลงเสียง AAC เป็นรูปแบบ NIST SPHERE ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

พร้อมสำหรับการประเมิน NIST

สร้างเสียงรูปแบบ NIST จาก AAC สำหรับ benchmark การประเมินเสียงพูดและการส่งฐานข้อมูลเสียงพูดของรัฐบาล

เครื่องมือออนไลน์ที่ง่าย

แปลง AAC เป็น NIST โดยไม่ต้องติดตั้ง toolkit เสียงพูดของรัฐบาล — อัปโหลด แปลง และดาวน์โหลด

ประมวลผลฝั่งเซิร์ฟเวอร์

การเข้ารหัสทั้งหมดเกิดขึ้นบนเซิร์ฟเวอร์คลาวด์ของเรา ทำให้เครื่องของคุณปราศจากซอฟต์แวร์ประมวลผลเสียงพูด

วิธีแปลง AAC เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

AAC (Advanced Audio Coding) เป็นตัวแทนรุ่นถัดมาของ MP3 ได้รับการกำหนดมาตรฐานโดย ISO/IEC ในฐานะส่วนหนึ่งของข้อกำหนด MPEG-2 และ MPEG-4 ในภายหลัง พัฒนาร่วมกันโดย Fraunhofer, Dolby, Sony, Nokia และ AT&T โดย AAC ให้คุณภาพเสียงที่เหนือกว่าที่บิตเรตเท่ากันหรือต่ำกว่า — สตรีม AAC 96 kbps โดยทั่วไปเทียบเท่ากับไฟล์ MP3 128 kbps ในแง่คุณภาพการรับรู้ ตัวแปลงสัญญาณใช้ modified discrete cosine transform ร่วมกับแบบจำลองจิตอะคูสติกขั้นสูงและ temporal noise shaping AAC เป็นรูปแบบเสียงเริ่มต้นของระบบนิเวศ Apple (iTunes, iPhone, iPad), YouTube และบริการสตรีมมิ่งมากมาย ข้อดีแรกคือประสิทธิภาพการบีบอัดที่ยอดเยี่ยม — เสียงคุณภาพสูงโดยใช้พื้นที่จัดเก็บและแบนด์วิดท์น้อยลงอย่างมาก ข้อดีที่สองคือรองรับอัตราสุ่มตัวอย่างตั้งแต่ 8 kHz ถึง 96 kHz และสูงสุด 48 แชนเนล เหมาะกับทุกอย่างตั้งแต่การโทรด้วยเสียงจนถึงเสียงเซอร์ราวด์ ข้อดีที่สามคือการนำไปใช้อย่างกว้างขวางโดย Apple และผู้ผลิตอื่น ๆ ทำให้อุปกรณ์ เบราว์เซอร์ และเครื่องเล่นสื่อสมัยใหม่แทบทุกเครื่องรองรับเนื้อหา AAC ได้โดยไม่ต้องติดตั้งปลั๊กอินเพิ่มเติม
ผู้พัฒนา: ISO/IEC Moving Picture Experts Group
เผยแพร่ครั้งแรก: 1997
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง AAC เป็น NIST?

NIST เป็นรูปแบบบนพื้นฐาน SPHERE ที่ใช้โดย National Institute of Standards and Technology สำหรับการประเมินเสียงพูด — จำเป็นสำหรับการส่ง NIST benchmark

โปรแกรมใดรองรับไฟล์ NIST?

เครื่องมือเสียงพูด NIST, SPHERE toolkit, Kaldi, SoX และเฟรมเวิร์กประมวลผลเสียงพูดอื่นๆ รองรับรูปแบบ NIST

NIST เหมือนกับ SPH ไหม?

ทั้งสองเกี่ยวข้องกันอย่างใกล้ชิด — ทั้งคู่ใช้รูปแบบส่วนหัว SPHERE NIST หมายถึงไฟล์ที่ปฏิบัติตามมาตรฐานการประเมินเสียงพูดของ NIST โดยเฉพาะ

ข้อกำหนดทั่วไปคืออะไร?

ไฟล์เสียงพูด NIST โดยทั่วไปมีเสียงโมโนที่ 8 หรือ 16 kHz — ตรงกับข้อกำหนด pipeline การจดจำเสียงพูดมาตรฐาน

แปลงเป็นชุดได้ไหม?

อัปโหลดไฟล์ AAC หลายไฟล์พร้อมกันและแปลงเป็นรูปแบบ NIST ทั้งหมดพร้อมกัน