ตัวแปลง OPUS เป็น NIST

สร้างไฟล์คำพูด NIST SPHERE จากเสียง OPUS

เลือกไฟล์ต่างๆ

วางไฟล์ต่างๆ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ

ไปยัง

มาตรฐานวิจัยคำพูด

NIST SPHERE จำเป็นสำหรับ ASR toolkits — สร้างไฟล์ที่จัดรูปแบบถูกต้องจากการบันทึก OPUS

เอาต์พุตพร้อมคลังข้อมูล

สร้างไฟล์ SPHERE พร้อมส่วนหัวที่ถูกต้องสำหรับการฝึกและวิเคราะห์รู้จำเสียงพูด

ประมวลผลออนไลน์

ไม่ต้องติดตั้ง toolkit — แปลง OPUS เป็น NIST SPHERE ในเบราว์เซอร์

วิธีแปลง OPUS เป็น NIST

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

Opus เป็นโคเดกเสียงแบบเปิดที่หลากหลาย ได้รับการกำหนดมาตรฐานโดย IETF ตาม RFC 6716 ในปี 2012 โดยผสมผสานสองแนวทางการเข้ารหัส — SILK สำหรับเสียงพูดและ CELT สำหรับดนตรี — เข้าเป็นอัลกอริทึมเดียวที่ผสานระหว่างสองแบบตามประเภทเนื้อหาและบิตเรต การออกแบบแบบไฮบริดนี้ทำให้ Opus มีประสิทธิภาพเหนือโคเดกอื่นเกือบทั้งหมดในการใช้งานหลากหลายรูปแบบ ตั้งแต่เสียงพูดที่มีเวลาแฝงต่ำที่ 6 kbps ไปจนถึงดนตรีคุณภาพสูงที่ 128 kbps และทุกอย่างที่อยู่ระหว่างนั้น รองรับบิตเรตตั้งแต่ 6 ถึง 510 kbps อัตราสุ่มตัวอย่างสูงสุด 48 kHz และขนาดเฟรมเล็กสุดเพียง 2.5 ms ทำให้มีเวลาแฝงเชิงอัลกอริทึมต่ำที่สุดในบรรดาโคเดกเสียงกระแสหลัก Opus มีข้อดีที่น่าสนใจสามประการ — ปลอดค่าลิขสิทธิ์และเป็นโอเพนซอร์สอย่างสมบูรณ์ ซึ่งขจัดอุปสรรคด้านการอนุญาตที่ขัดขวางโคเดกที่เป็นกรรมสิทธิ์ นอกจากนี้ยังบรรลุคุณภาพที่โปร่งใสที่บิตเรตประมาณครึ่งหนึ่งของ MP3 และเอาชนะ AAC ที่อัตราเทียบเท่า และเวลาแฝงต่ำทำให้เป็นโคเดกบังคับสำหรับ WebRTC ดังนั้นเบราว์เซอร์สมัยใหม่ทุกตัวจึงมาพร้อมตัวถอดรหัส Opus WhatsApp, Discord, Zoom และ YouTube ทั้งหมดใช้ Opus สำหรับเสียงแบบเรียลไทม์

ผู้พัฒนา: Internet Engineering Task Force

เผยแพร่ครั้งแรก: 11 กันยายน 2012

NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด

ผู้พัฒนา: National Institute of Standards and Technology

เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง OPUS เป็น NIST?

NIST SPHERE จำเป็นสำหรับ speech processing toolkits หลัก การวิจัยภาษาศาสตร์และการฝึก ASR ต้องการเสียงอินพุตรูปแบบ SPHERE

อะไรใช้ NIST?

HTK, Kaldi, เครื่องมือประเมินผลคำพูด NIST และคลังข้อมูลทางวิชาการใช้ SPHERE เป็นรูปแบบเสียงหลัก

NIST เหมือนกับ SPH หรือไม่?

ใช่ — ทั้งสองหมายถึง SPHERE (SPeech HEader Resources) ที่กำหนดโดย National Institute of Standards and Technology

ใช้อัตราตัวอย่างเท่าไร?

SPHERE มักใช้ 8 หรือ 16 kHz — อัตรามาตรฐานสำหรับการวิจัยคำพูดทางโทรศัพท์และแบนด์กว้าง

แปลงเป็นชุดได้ไหม?

อัปโหลดชุดข้อมูลเสียงพูด OPUS ทั้งหมดและแปลงเป็น NIST SPHERE ในชุดเดียว

การแปลงที่เกี่ยวข้อง

OPUS เป็น MP3

OPUS เป็น WAV

OPUS เป็น AAC

OPUS เป็น M4A

OPUS เป็น OGG

OPUS เป็น FLAC

OPUS เป็น WMA

OPUS เป็น AIFF

OPUS เป็น MP2

OPUS เป็น AC3

OPUS เป็น M4R

OPUS เป็น AMR

OPUS เป็น GSM

OPUS เป็น WV

OPUS เป็น VOC

OPUS เป็น W64

OPUS เป็น TXW

OPUS เป็น CDDA

OPUS เป็น AU

OPUS เป็น DTS

OPUS เป็น RA

OPUS เป็น VOX

OPUS เป็น WVE

OPUS เป็น TTA

OPUS เป็น SPX

OPUS เป็น 8SVX

OPUS เป็น OGA

OPUS เป็น AVR

OPUS เป็น CAF

OPUS เป็น SMP

OPUS เป็น SD2

OPUS เป็น SLN

OPUS เป็น CVS

OPUS เป็น VMS

OPUS เป็น IMA

OPUS เป็น PVF

OPUS เป็น PRC

OPUS เป็น MAUD

OPUS เป็น AMB

OPUS เป็น SND

OPUS เป็น SNDR

OPUS เป็น SNDT

OPUS เป็น CVSD

OPUS เป็น CVU

OPUS เป็น DVMS

OPUS เป็น FAP

OPUS เป็น PAF

OPUS เป็น FSSD

OPUS เป็น SOU

OPUS เป็น GSRT

OPUS เป็น HCOM

OPUS เป็น HTK

OPUS เป็น IRCAM

OPUS เป็น SPH

OPUS เป็น NIST

ตัวแปลงเฉพาะ

MP3 เป็น NIST

MP4 เป็น NIST

WAV เป็น NIST

FLAC เป็น NIST

M4A เป็น NIST

FLV เป็น NIST

PVF เป็น NIST

VOX เป็น NIST

3GP เป็น NIST

3G2 เป็น NIST

AAF เป็น NIST

ASF เป็น NIST

AV1 เป็น NIST

AVCHD เป็น NIST

AVI เป็น NIST

CAVS เป็น NIST

DIVX เป็น NIST

DV เป็น NIST

F4V เป็น NIST

HEVC เป็น NIST

M2TS เป็น NIST

M2V เป็น NIST

M4V เป็น NIST

MJPEG เป็น NIST

MKV เป็น NIST

MOD เป็น NIST

MOV เป็น NIST

MPEG เป็น NIST

MPEG-2 เป็น NIST

MPG เป็น NIST