ตัวแปลง WMA เป็น SPH

สร้างเสียงวิจัยเสียงพูด SPHERE จาก WMA

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

รูปแบบคลังเสียงพูด

SPH เป็นมาตรฐานสำหรับชุดข้อมูลเสียงพูด — แปลง WMA สำหรับใช้ในงานวิจัย

เตรียมชุดข้อมูล

ประมวลผลคอลเลกชัน WMA ทั้งหมดเป็น SPH พร้อมกัน

แปลงออนไลน์

ไม่ต้องติดตั้งชุดเครื่องมือเสียงพูด — แปลง WMA เป็น SPH ในเบราว์เซอร์

วิธีแปลง WMA เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

WMA (Windows Media Audio) เป็นตระกูลโคเดกเสียงที่เป็นกรรมสิทธิ์ พัฒนาโดย Microsoft และเปิดตัวครั้งแรกในปี 1999 เป็นส่วนหนึ่งของเฟรมเวิร์ก Windows Media สร้างขึ้นเพื่อแข่งขันกับ MP3 และ AAC โดย WMA Standard ใช้การเข้ารหัสเชิงการรับรู้เพื่อให้คุณภาพใกล้เคียง CD ที่บิตเรตต่ำสุด 64 kbps — ประมาณครึ่งหนึ่งของอัตราข้อมูลที่ MP3 ต้องการสำหรับผลลัพธ์ที่เทียบเคียงได้ ตระกูลโคเดกขยายตัวรวมถึง WMA Professional สำหรับเสียงรอบทิศทางและความละเอียดสูง WMA Lossless สำหรับการบีบอัดแบบไม่สูญเสียคุณภาพสำหรับเก็บถาวร และ WMA Voice ที่ปรับแต่งสำหรับเนื้อหาเสียงพูดที่บิตเรตต่ำมาก การผสานรวมอย่างลึกซึ้งกับ Windows, Windows Media Player และระบบนิเวศ Zune ทำให้ WMA มีข้อได้เปรียบด้านการเผยแพร่ตลอดทศวรรษ 2000 และการรองรับการจัดการสิทธิ์ดิจิทัล (DRM) ทำให้เป็นที่น่าสนใจสำหรับร้านขายเพลงออนไลน์ในยุคนั้น การเข้ารหัสและถอดรหัสจัดการโดย Windows โดยตรง ไม่ต้องใช้ซอฟต์แวร์บุคคลที่สามสำหรับการเล่นบนเครื่อง Windows ใดๆ การรองรับข้ามแพลตฟอร์มดีขึ้นผ่านไลบรารีเช่น FFmpeg และ GStreamer แม้ว่า WMA จะยังเข้ากันได้น้อยกว่า MP3 หรือ AAC บนอุปกรณ์ที่ไม่ใช่ของ Microsoft รูปแบบนี้ยังคงปรากฏในไลบรารีสื่อเก่า แม้โคเดกรุ่นใหม่จะเข้ามาแทนที่เป็นส่วนใหญ่สำหรับการสตรีมและการใช้งานพกพา
ผู้พัฒนา: Microsoft Corporation
เผยแพร่ครั้งแรก: 1999
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง WMA เป็น SPH?

SPH (SPHERE) เป็นมาตรฐาน NIST สำหรับคลังข้อมูลวิจัยเสียงพูด ชุดเครื่องมือรู้จำเสียงพูดอัตโนมัติเช่น Kaldi และ HTK นำเข้า WMA ไม่ได้ — ต้องการอินพุตรูปแบบ SPHERE

เครื่องมือและแพลตฟอร์มวิจัยใดใช้ไฟล์ SPH?

Kaldi, HTK, CMU Sphinx, เครื่องมือประเมิน NIST และเฟรมเวิร์กรู้จำเสียงพูดทางวิชาการส่วนใหญ่ต้องการ SPH เป็นมาตรฐานโดยพฤตินัยสำหรับชุดข้อมูลประเมินเสียงพูด

SPH กับ NIST เป็นรูปแบบเดียวกันไหม?

ใช่ — ทั้งสองชื่อหมายถึงรูปแบบ SPHERE ที่กำหนดโดย National Institute of Standards and Technology SPH เป็นนามสกุลไฟล์ทั่วไปในชุมชนวิจัยเสียงพูด

การบันทึก WMA จะคงคุณภาพเพียงพอใน SPH ไหม?

SPHERE รองรับอัตราสุ่มตัวอย่างและความลึกบิตหลายแบบ การแปลงจะรักษาคุณภาพเสียงในไฟล์ WMA ซึ่งมักเพียงพอสำหรับงานรู้จำเสียงพูด

แปลงชุดข้อมูลเสียงพูด WMA ขนาดใหญ่เป็น SPH พร้อมกันได้ไหม?

ได้ — อัปโหลดคอลเลกชันบันทึกเสียงพูด WMA ทั้งหมดและ convertio.tools จะสร้างไฟล์ SPH แยกสำหรับแต่ละไฟล์ เหมาะสำหรับเตรียมคลังวิจัยอย่างมีประสิทธิภาพ