ตัวแปลง WMA เป็น NIST

สร้างไฟล์เสียงพูด NIST SPHERE จากเสียง WMA

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

งานวิจัยเสียงพูด

NIST SPHERE เป็นมาตรฐานสำหรับ ASR — แปลง WMA สำหรับท่อส่งงานวิจัย

พร้อมสำหรับคลังข้อมูล

สร้าง SPHERE พร้อมส่วนหัวที่ถูกต้องสำหรับการฝึกจดจำเสียงพูด

ประมวลผลออนไลน์

ไม่ต้องติดตั้งชุดเครื่องมือ — แปลง WMA เป็น NIST ในเบราว์เซอร์

วิธีแปลง WMA เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

WMA (Windows Media Audio) เป็นตระกูลโคเดกเสียงที่เป็นกรรมสิทธิ์ พัฒนาโดย Microsoft และเปิดตัวครั้งแรกในปี 1999 เป็นส่วนหนึ่งของเฟรมเวิร์ก Windows Media สร้างขึ้นเพื่อแข่งขันกับ MP3 และ AAC โดย WMA Standard ใช้การเข้ารหัสเชิงการรับรู้เพื่อให้คุณภาพใกล้เคียง CD ที่บิตเรตต่ำสุด 64 kbps — ประมาณครึ่งหนึ่งของอัตราข้อมูลที่ MP3 ต้องการสำหรับผลลัพธ์ที่เทียบเคียงได้ ตระกูลโคเดกขยายตัวรวมถึง WMA Professional สำหรับเสียงรอบทิศทางและความละเอียดสูง WMA Lossless สำหรับการบีบอัดแบบไม่สูญเสียคุณภาพสำหรับเก็บถาวร และ WMA Voice ที่ปรับแต่งสำหรับเนื้อหาเสียงพูดที่บิตเรตต่ำมาก การผสานรวมอย่างลึกซึ้งกับ Windows, Windows Media Player และระบบนิเวศ Zune ทำให้ WMA มีข้อได้เปรียบด้านการเผยแพร่ตลอดทศวรรษ 2000 และการรองรับการจัดการสิทธิ์ดิจิทัล (DRM) ทำให้เป็นที่น่าสนใจสำหรับร้านขายเพลงออนไลน์ในยุคนั้น การเข้ารหัสและถอดรหัสจัดการโดย Windows โดยตรง ไม่ต้องใช้ซอฟต์แวร์บุคคลที่สามสำหรับการเล่นบนเครื่อง Windows ใดๆ การรองรับข้ามแพลตฟอร์มดีขึ้นผ่านไลบรารีเช่น FFmpeg และ GStreamer แม้ว่า WMA จะยังเข้ากันได้น้อยกว่า MP3 หรือ AAC บนอุปกรณ์ที่ไม่ใช่ของ Microsoft รูปแบบนี้ยังคงปรากฏในไลบรารีสื่อเก่า แม้โคเดกรุ่นใหม่จะเข้ามาแทนที่เป็นส่วนใหญ่สำหรับการสตรีมและการใช้งานพกพา
ผู้พัฒนา: Microsoft Corporation
เผยแพร่ครั้งแรก: 1999
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง WMA เป็น NIST?

NIST SPHERE เป็นรูปแบบอินพุตบังคับสำหรับชุดเครื่องมือรู้จำเสียงพูดเช่น Kaldi และ HTK ไปป์ไลน์เหล่านี้ปฏิเสธ WMA ทั้งหมด — การแปลงเป็น SPHERE จำเป็นก่อนการฝึกหรือประเมินผล

เครื่องมือประมวลผลเสียงพูดใดใช้ NIST SPHERE?

Kaldi, HTK, CMU Sphinx, เครื่องมือประเมิน NIST และเฟรมเวิร์กวิจัยมหาวิทยาลัยมากมายคาดหวังอินพุต SPHERE เป็นมาตรฐานที่แท้จริงสำหรับการแจกจ่ายคลังข้อมูลเสียงพูดทั่วโลก

NIST เหมือนกับ SPH หรือ SPHERE ไหม?

ใช่ — ทั้งสามหมายถึงรูปแบบเดียวกัน: SPeech HEader REsources ที่พัฒนาโดย NIST นามสกุลไฟล์อาจต่างกัน (.nist, .sph) แต่โครงสร้างภายในเหมือนกัน

การแปลงรักษาคุณภาพเสียงสำหรับ ASR ไหม?

NIST SPHERE เก็บเสียง PCM — เนื้อหา WMA ที่ถอดรหัสจะถูกถ่ายโอนโดยไม่มีการบีบอัดเพิ่มเติม ความแม่นยำในการรู้จำขึ้นอยู่กับคุณภาพต้นทางซึ่งถูกรักษาระหว่างการแปลง

แปลงชุดข้อมูล WMA ทั้งหมดเป็น NIST ในครั้งเดียวได้ไหม?

ได้ — อัปโหลดชุดไฟล์ WMA ทั้งหมดแล้ว Convertio จะสร้างไฟล์ NIST SPHERE สำหรับแต่ละไฟล์พร้อมกัน ดาวน์โหลดทีละไฟล์หรือเป็นไฟล์เก็บถาวรเพื่อใช้ทันทีในไปป์ไลน์วิจัย