เครื่องมือแปลงไฟล์ SPH เป็น SPX

แปลงไฟล์ sph ของคุณให้เป็น spx ผ่านช่องทางออนไลน์ฟรี

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง

การตั้งค่า

ตั้งค่าบิตเรตเสียงขาออกโดยรวมสำหรับ Speex. Speex ได้รับการออกแบบมาเพื่อเข้ารหัสเสียงพูดของมนุษย์ จึงเข้าถึงความโปร่งใสที่บิตเรตต่ำพิเศษซึ่งมีบิตเรตสูงสุดอยู่ที่ 44 kbps
กำหนดจำนวนช่องสัญญาณเสียง การตั้งค่านี้มีประโยชน์มากที่สุดเมื่อทำการลด (ดาวน์มิกซ์) ช่องสัญญาณ (เช่น จาก 5.1 เป็นสเตอริโอ)
กำหนดอัตราตัวอย่างของเสียง เพลงที่มีคลื่นความถี่เต็มที่ (20 Hz - 20 kHz) ต้องมีค่าไม่ต่ำกว่า 44.1 kHz เพื่อให้เกิดความโปร่งใส สามารถอ่านข้อมูลเพิ่มเติมได้ใน วิกิ

sph

SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
อ่านเพิ่มเติม

spx

Speex เป็นโคเดกเสียงโอเพนซอร์สที่สร้างขึ้นโดยเฉพาะสำหรับการบีบอัดเสียงพูด พัฒนาโดย Jean-Marc Valin ภายใต้ Xiph.Org Foundation เปิดตัวครั้งแรกในเดือนตุลาคม 2002 โดยมุ่งเป้าไปที่การสื่อสารด้วยเสียงผ่าน IP การประชุมทางเสียง และทุกสถานการณ์ที่ต้องส่งเสียงพูดอย่างมีประสิทธิภาพผ่านเครือข่าย ไฟล์ SPX บรรจุเสียงที่เข้ารหัสด้วย Speex ในคอนเทนเนอร์ Ogg ผสมผสานการปรับแต่งเสียงพูดของโคเดกกับความสามารถในการสตรีมของ Ogg รองรับอัตราสุ่มตัวอย่างสามระดับ — แบนด์แคบที่ 8 kHz แบนด์กว้างที่ 16 kHz และอัลตราแบนด์กว้างที่ 32 kHz — พร้อมการเข้ารหัสบิตเรตแปรผันที่ปรับตัวแบบเรียลไทม์ตามความซับซ้อนของเสียงพูด ข้อดีที่โดดเด่นคือลักษณะที่ปลอดสิทธิบัตรภายใต้สัญญาอนุญาต BSD ซึ่งให้นักพัฒนาฝังไว้ในผลิตภัณฑ์ทั้งเชิงพาณิชย์และโอเพนซอร์สได้อย่างอิสระ Speex ยังรวมการตัดเสียงสะท้อน การระงับเสียงรบกวน และการควบคุมอัตราขยายอัตโนมัติ — ฟีเจอร์ที่โคเดกคู่แข่งมักมอบหมายให้ไลบรารีภายนอก แม้ว่าผู้สร้างจะแนะนำ Opus อย่างเป็นทางการเป็นตัวสืบทอดตั้งแต่ปี 2012 แต่ Speex ยังคงถูกใช้งานในระบบ VoIP เดิม การบันทึกที่เก็บถาวร และอุปกรณ์ฝังตัวที่ตัวถอดรหัสที่ใช้ทรัพยากรน้อยยังคงมีคุณค่า
อ่านเพิ่มเติม
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิธีแปลง SPH เป็น SPX

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ spx หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ spx ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990
Speex เป็นโคเดกเสียงโอเพนซอร์สที่สร้างขึ้นโดยเฉพาะสำหรับการบีบอัดเสียงพูด พัฒนาโดย Jean-Marc Valin ภายใต้ Xiph.Org Foundation เปิดตัวครั้งแรกในเดือนตุลาคม 2002 โดยมุ่งเป้าไปที่การสื่อสารด้วยเสียงผ่าน IP การประชุมทางเสียง และทุกสถานการณ์ที่ต้องส่งเสียงพูดอย่างมีประสิทธิภาพผ่านเครือข่าย ไฟล์ SPX บรรจุเสียงที่เข้ารหัสด้วย Speex ในคอนเทนเนอร์ Ogg ผสมผสานการปรับแต่งเสียงพูดของโคเดกกับความสามารถในการสตรีมของ Ogg รองรับอัตราสุ่มตัวอย่างสามระดับ — แบนด์แคบที่ 8 kHz แบนด์กว้างที่ 16 kHz และอัลตราแบนด์กว้างที่ 32 kHz — พร้อมการเข้ารหัสบิตเรตแปรผันที่ปรับตัวแบบเรียลไทม์ตามความซับซ้อนของเสียงพูด ข้อดีที่โดดเด่นคือลักษณะที่ปลอดสิทธิบัตรภายใต้สัญญาอนุญาต BSD ซึ่งให้นักพัฒนาฝังไว้ในผลิตภัณฑ์ทั้งเชิงพาณิชย์และโอเพนซอร์สได้อย่างอิสระ Speex ยังรวมการตัดเสียงสะท้อน การระงับเสียงรบกวน และการควบคุมอัตราขยายอัตโนมัติ — ฟีเจอร์ที่โคเดกคู่แข่งมักมอบหมายให้ไลบรารีภายนอก แม้ว่าผู้สร้างจะแนะนำ Opus อย่างเป็นทางการเป็นตัวสืบทอดตั้งแต่ปี 2012 แต่ Speex ยังคงถูกใช้งานในระบบ VoIP เดิม การบันทึกที่เก็บถาวร และอุปกรณ์ฝังตัวที่ตัวถอดรหัสที่ใช้ทรัพยากรน้อยยังคงมีคุณค่า
ผู้พัฒนา: Xiph.Org Foundation
เผยแพร่ครั้งแรก: 15 ตุลาคม 2002