เครื่องมือแปลงไฟล์ SPH เป็น VOX
แปลงไฟล์ sph ของคุณให้เป็น vox ผ่านช่องทางออนไลน์ฟรี
sph
vox
วิธีแปลง SPH เป็น VOX
เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.
เลือกรูปแบบไฟล์ vox หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)
ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ vox ของคุณได้หลังจากนั้น
เกี่ยวกับรูปแบบไฟล์
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
VOX เป็นรูปแบบเสียงแบบไม่มีส่วนหัวที่สร้างขึ้นรอบการเข้ารหัส Dialogic ADPCM ถูกนำมาใช้อย่างแพร่หลายในระบบโทรศัพท์ ระบบตอบรับด้วยเสียงอัตโนมัติ (IVR) และแพลตฟอร์มวอยซ์เมลตั้งแต่ทศวรรษ 1980 ตัวอย่างเสียงแต่ละตัวถูกบีบอัดเป็น 4 บิตโดยใช้อัลกอริทึมที่พัฒนาโดย Oki Electric และนำไปใช้ในฮาร์ดแวร์บนการ์ดอินเทอร์เฟซโทรศัพท์ของ Dialogic Corporation ไฟล์ VOX โดยทั่วไปใช้อัตราสุ่มตัวอย่าง 6000 หรือ 8000 Hz สร้างการบันทึกที่กระทัดรัดมากซึ่งปรับแต่งสำหรับความชัดเจนของเสียงพูดมากกว่าความเที่ยงตรงทางดนตรี เนื่องจากรูปแบบไม่มีส่วนหัว ซอฟต์แวร์เล่นต้องทราบอัตราสุ่มตัวอย่างและพารามิเตอร์การเข้ารหัสล่วงหน้า — ข้อแลกเปลี่ยนที่ลดโอเวอร์เฮดแต่ต้องการการจัดการไฟล์อย่างระมัดระวัง ข้อดีหลักของ VOX คือประสิทธิภาพในการจัดเก็บ — การบันทึกเสียงหนึ่งนาทีที่ 8 kHz ใช้พื้นที่ประมาณ 240 KB ทำให้เหมาะสมสำหรับระบบที่จัดเก็บพรอมต์หลายพันรายการ Dialogic ADPCM สอดคล้องกับมาตรฐาน ITU-T G.726 รับประกันความเข้ากันได้ข้ามอุปกรณ์โทรศัพท์จากผู้ผลิตต่างๆ แม้ว่าศูนย์บริการลูกค้าสมัยใหม่จะย้ายไปสู่ระบบ IP พร้อมโคเดกอย่าง Opus แต่ไลบรารี VOX จำนวนมากยังคงมีอยู่ในระบบ IVR เดิมและคลังเก็บถาวรเพื่อการปฏิบัติตามกฎระเบียบทั่วโลก