เครื่องมือแปลงไฟล์ DSS เป็น SPH

แปลงไฟล์ dss ของคุณให้เป็น sph ผ่านช่องทางออนไลน์ฟรี

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิธีแปลง DSS เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

DSS (Digital Speech Standard) เป็นรูปแบบบันทึกเสียงพูดที่เป็นกรรมสิทธิ์ พัฒนาโดย Olympus, Philips และ Grundig ในปี 1994 ผ่าน International Voice Association สร้างมาสำหรับเวิร์กโฟลว์การบอกคำบอก DSS ใช้การบีบอัดที่ปรับให้เหมาะกับเสียงพูดที่อัตราบิตต่ำมาก — มาตรฐานดั้งเดิมเข้ารหัสที่ประมาณ 13.7 kbps ขณะที่ DSS Pro ให้ประมาณ 28 kbps พร้อมความชัดเจนที่ดีขึ้น ตัวแปลงสัญญาณจัดสรรงบประมาณไปยังช่วงความถี่ที่เป็นลักษณะเฉพาะของเสียงพูดมนุษย์แทนที่จะเป็นเสียงแบบสเปกตรัมเต็ม สร้างไฟล์ที่กะทัดรัดเป็นพิเศษ เครื่องบันทึกมืออาชีพจาก Olympus และ Philips ใช้ DSS เป็นค่าเริ่มต้น ผสานรวมกับซอฟต์แวร์ถอดความที่รองรับธงจัดลำดับความสำคัญ บุ๊กมาร์ก และการระบุผู้เขียนในเมตาดาต้าของไฟล์ ข้อดีคือประสิทธิภาพขนาดไฟล์: การบอกคำบอกหนึ่งชั่วโมงใช้เพียง 6-12 MB เหมาะสำหรับสภาพแวดล้อมที่มีปริมาณมาก เช่น โรงพยาบาล สำนักงานกฎหมาย และศาล เมตาดาต้าในตัวช่วยให้สามารถจัดเส้นทางผ่านคิวถอดความได้อย่างราบรื่นพร้อมการจัดเรียงลำดับความสำคัญอัตโนมัติ แม้ DSS จะเป็นรูปแบบปิดที่จำกัดการเล่นเฉพาะซอฟต์แวร์ที่เข้ากันได้ แต่ความโดดเด่นในการบอกคำบอกระดับมืออาชีพรับประกันการรองรับอย่างต่อเนื่องจากแพลตฟอร์มถอดความหลัก
ผู้พัฒนา: Olympus / Philips / Grundig
เผยแพร่ครั้งแรก: 1994
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990