ตัวแปลง AAC เป็น SPH

แปลงเสียง AAC เป็นรูปแบบเสียงพูด NIST SPH ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

รูปแบบ Corpus เสียงพูด

สร้างไฟล์ NIST SPHERE จากเสียง AAC — คอนเทนเนอร์มาตรฐานสำหรับแจกจ่ายข้อมูลการวิจัยเสียงพูด

ไม่ต้องใช้ Toolkit

แปลง AAC เป็น SPH บนเซิร์ฟเวอร์โดยไม่ต้องติดตั้ง NIST SPHERE toolkit ในเครื่องของคุณ

ความปลอดภัยของข้อมูล

ไฟล์ AAC ที่อัปโหลดถูกลบหลังประมวลผล ไฟล์ SPH ผลลัพธ์จะถูกลบออกจากเซิร์ฟเวอร์ภายใน 24 ชั่วโมง

วิธีแปลง AAC เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

AAC (Advanced Audio Coding) เป็นตัวแทนรุ่นถัดมาของ MP3 ได้รับการกำหนดมาตรฐานโดย ISO/IEC ในฐานะส่วนหนึ่งของข้อกำหนด MPEG-2 และ MPEG-4 ในภายหลัง พัฒนาร่วมกันโดย Fraunhofer, Dolby, Sony, Nokia และ AT&T โดย AAC ให้คุณภาพเสียงที่เหนือกว่าที่บิตเรตเท่ากันหรือต่ำกว่า — สตรีม AAC 96 kbps โดยทั่วไปเทียบเท่ากับไฟล์ MP3 128 kbps ในแง่คุณภาพการรับรู้ ตัวแปลงสัญญาณใช้ modified discrete cosine transform ร่วมกับแบบจำลองจิตอะคูสติกขั้นสูงและ temporal noise shaping AAC เป็นรูปแบบเสียงเริ่มต้นของระบบนิเวศ Apple (iTunes, iPhone, iPad), YouTube และบริการสตรีมมิ่งมากมาย ข้อดีแรกคือประสิทธิภาพการบีบอัดที่ยอดเยี่ยม — เสียงคุณภาพสูงโดยใช้พื้นที่จัดเก็บและแบนด์วิดท์น้อยลงอย่างมาก ข้อดีที่สองคือรองรับอัตราสุ่มตัวอย่างตั้งแต่ 8 kHz ถึง 96 kHz และสูงสุด 48 แชนเนล เหมาะกับทุกอย่างตั้งแต่การโทรด้วยเสียงจนถึงเสียงเซอร์ราวด์ ข้อดีที่สามคือการนำไปใช้อย่างกว้างขวางโดย Apple และผู้ผลิตอื่น ๆ ทำให้อุปกรณ์ เบราว์เซอร์ และเครื่องเล่นสื่อสมัยใหม่แทบทุกเครื่องรองรับเนื้อหา AAC ได้โดยไม่ต้องติดตั้งปลั๊กอินเพิ่มเติม
ผู้พัฒนา: ISO/IEC Moving Picture Experts Group
เผยแพร่ครั้งแรก: 1997
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง AAC เป็น SPH?

SPH (SPHERE) คือรูปแบบมาตรฐานสำหรับ corpus การวิจัยเสียงพูดของ NIST — จำเป็นสำหรับการศึกษาภาษาศาสตร์และการพัฒนาเทคโนโลยีเสียงพูด

โปรแกรมใดอ่านไฟล์ SPH?

NIST SPHERE toolkit, HTK, Kaldi และ SoX สามารถอ่านและประมวลผลไฟล์เสียงรูปแบบ SPH ได้

SPH ใช้นอกขอบเขตการวิจัยไหม?

แทบไม่ — SPH เป็นรูปแบบเชิงวิชาการและรัฐบาลหลักสำหรับการแจกจ่ายข้อมูลเสียงพูดที่มีป้ายกำกับ

ข้อกำหนด SPH ทั่วไปคืออะไร?

ไฟล์ SPH โดยทั่วไปจัดเก็บเสียงโมโน 8-16 kHz พร้อมส่วนหัวข้อความที่อธิบายสภาพการบันทึกและข้อมูลเมตาผู้พูด

แปลงเป็นชุดได้ไหม?

อัปโหลดไฟล์ AAC หลายไฟล์และแปลงเป็น SPH ทั้งหมดพร้อมกัน — เป็นประโยชน์สำหรับการเตรียม dataset การวิจัยเสียงพูด