เครื่องมือแปลงไฟล์ SPH เป็น AU
แปลงไฟล์ sph ของคุณให้เป็น au ผ่านช่องทางออนไลน์ฟรี
sph
au
วิธีแปลง SPH เป็น AU
เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.
เลือกรูปแบบไฟล์ au หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)
ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ au ของคุณได้หลังจากนั้น
เกี่ยวกับรูปแบบไฟล์
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
AU เป็นรูปแบบไฟล์เสียงที่เปิดตัวโดย Sun Microsystems สำหรับเวิร์กสเตชัน Unix และแพลตฟอร์ม NeXT มีส่วนหัวขนาดเล็กเพียง 24 ไบต์ที่ระบุตำแหน่งข้อมูล ขนาด ประเภทการเข้ารหัส อัตราสุ่มตัวอย่าง และจำนวนแชนเนล ตามด้วยข้อมูลเสียง AU รองรับการเข้ารหัสหลายแบบ ได้แก่ linear PCM แบบไม่บีบอัดที่ความลึกบิตต่าง ๆ, mu-law และ A-law companding (การบีบอัดแบบลอการิทึมที่ใช้ในระบบโทรศัพท์) และตัวแปร ADPCM หลายชนิด ความหลากหลายนี้ทำให้ AU เป็นม้าศึกในสภาพแวดล้อม Unix ยุคแรก เสียงเว็บ (Java applets ใช้ AU เป็นค่าเริ่มต้น) และแอปพลิเคชันโทรศัพท์ ข้อดีคือความเรียบง่าย: ส่วนหัวขนาดกะทัดรัดและโครงสร้างตรงไปตรงมาทำให้การแยกวิเคราะห์ สร้าง และสตรีมทำได้ง่ายมากในเชิงโปรแกรม ตัวเลือก mu-law ในตัวให้ข้อดีเพิ่มเติม ให้คุณภาพเสียงพูดที่เหมาะสมที่เพียง 8 KB ต่อวินาที — ครึ่งหนึ่งของอัตราเสียง 16 บิตแบบไม่บีบอัด — มีค่ามากเมื่อพื้นที่จัดเก็บและแบนด์วิดท์ยังมีจำกัด แม้รูปแบบสมัยใหม่จะเข้ามาแทนที่ AU ในแอปพลิเคชันสำหรับผู้บริโภคเป็นส่วนใหญ่ แต่ยังคงมีที่ยืนในการคำนวณเชิงวิทยาศาสตร์และท่อประมวลผลเสียงที่ต้องการค่าใช้จ่ายน้อยที่สุดและพฤติกรรมข้ามแพลตฟอร์มที่เชื่อถือได้