ตัวแปลง OGG เป็น SPH

สร้างเสียงวิจัยคำพูด SPHERE จาก OGG

เลือกไฟล์ต่างๆ

วางไฟล์ต่างๆ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ

ไปยัง

มาตรฐานคลังข้อมูลคำพูด

SPH เป็นรูปแบบเบื้องหลังชุดข้อมูลคำพูดหลัก — แปลงไฟล์บันทึก OGG เป็นเสียงวิจัยที่จัดรูปแบบถูกต้อง

เตรียมชุดข้อมูล

ประมวลผลคอลเลกชันเสียงพูด OGG ทั้งหมดเป็น SPH พร้อมกัน — เตรียมคลังข้อมูลวิจัยในการดำเนินการเดียว

แปลงออนไลน์

ไม่ต้องติดตั้ง speech toolkit — สร้างไฟล์ SPH จาก OGG โดยตรงผ่านเบราว์เซอร์

วิธีแปลง OGG เป็น SPH

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

OGG Vorbis เป็นโคเดกเสียงแบบสูญเสียคุณภาพที่เปิดเผยและปลอดค่าลิขสิทธิ์ ภายในรูปแบบคอนเทนเนอร์ Ogg ซึ่งพัฒนาโดย Xiph.Org Foundation ทั้งคู่ Vorbis ออกแบบมาเป็นทางเลือกที่ปลอดสิทธิบัตรแทน MP3 และ AAC โดยใช้การเข้ารหัส modified discrete cosine transform (MDCT) พร้อมการเข้ารหัสบิตเรตแปรผันที่ปรับตัวตามความซับซ้อนของสัญญาณในแต่ละเฟรม การทดสอบฟังแบบบอดได้แสดงให้เห็นอย่างสม่ำเสมอว่า Vorbis ให้คุณภาพการรับรู้ที่เทียบเท่าหรือเหนือกว่า MP3 โดยเฉพาะในช่วง 96-192 kbps รูปแบบนี้รองรับอัตราสุ่มตัวอย่างตั้งแต่ 8 kHz ถึง 192 kHz และ 1 ถึง 255 ช่องสัญญาณ ครอบคลุมตั้งแต่เสียงโมโนไปจนถึงมิกซ์เซอร์ราวด์ ข้อได้เปรียบที่โดดเด่นคือการไม่มีค่าธรรมเนียมลิขสิทธิ์อย่างสิ้นเชิง — นักพัฒนาเกม แพลตฟอร์มสตรีมมิง และผู้ผลิตฮาร์ดแวร์สามารถนำ Vorbis ไปใช้ได้โดยไม่ต้องกังวลเรื่องค่าลิขสิทธิ์ Spotify ใช้ Vorbis เป็นโคเดกสตรีมมิงหลักมาหลายปีด้วยเหตุผลนี้ รูปแบบนี้ยังจัดการการเสื่อมคุณภาพที่บิตเรตต่ำได้อย่างดีกว่าคู่แข่งหลายราย ซึ่งเป็นเหตุผลที่ยังคงเป็นที่นิยมในวิดีโอเกมที่พื้นที่จัดเก็บมีจำกัดและเอฟเฟกต์เสียงนับพันต้องแข่งกันใช้พื้นที่ VLC, Firefox, Chrome และ Android ทั้งหมดรองรับการถอดรหัส Vorbis โดยตรง

ผู้พัฒนา: Xiph.Org Foundation

เผยแพร่ครั้งแรก: 1 พฤษภาคม 2000

SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้

ผู้พัฒนา: National Institute of Standards and Technology

เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง OGG เป็น SPH?

SPH (SPHERE) เป็นรูปแบบที่ NIST กำหนดสำหรับชุดข้อมูลวิจัยคำพูด ไปป์ไลน์ฝึก ASR และเครื่องมือภาษาศาสตร์คาดหวังอินพุตรูปแบบ SPHERE

อะไรใช้ไฟล์ SPH?

Kaldi, HTK, เครื่องมือประเมินผล NIST และคลังข้อมูลคำพูดทางวิชาการเช่น TIMIT และ Switchboard ใช้ SPHERE เป็นรูปแบบเสียง

SPH เหมือนกับ NIST หรือไม่?

SPH และ NIST ทั้งคู่หมายถึงรูปแบบ SPHERE — SPeech HEader Resources ที่กำหนดโดย National Institute of Standards and Technology

SPH ใช้อัตราตัวอย่างเท่าไร?

คลังข้อมูลคำพูดมักใช้ 8 หรือ 16 kHz ตัวแปลงจัดการการ resample จากแหล่ง OGG โดยอัตโนมัติ

แปลงชุดข้อมูลทั้งหมดได้ไหม?

อัปโหลดชุดไฟล์บันทึกเสียงพูด OGG และสร้างเอาต์พุต SPH สำหรับทุกไฟล์พร้อมกัน — พร้อมสำหรับการวิจัย ASR

การแปลงที่เกี่ยวข้อง

OGG เป็น MP3

OGG เป็น WAV

OGG เป็น M4A

OGG เป็น AAC

OGG เป็น FLAC

OGG เป็น WMA

OGG เป็น OPUS

OGG เป็น AIFF

OGG เป็น M4R

OGG เป็น AMR

OGG เป็น GSM

OGG เป็น MP2

OGG เป็น OGA

OGG เป็น CAF

OGG เป็น AU

OGG เป็น AC3

OGG เป็น W64

OGG เป็น 8SVX

OGG เป็น TXW

OGG เป็น WV

OGG เป็น CDDA

OGG เป็น DTS

OGG เป็น VOC

OGG เป็น VOX

OGG เป็น SPX

OGG เป็น SND

OGG เป็น SMP

OGG เป็น SLN

OGG เป็น RA

OGG เป็น WVE

OGG เป็น AMB

OGG เป็น PAF

OGG เป็น CVS

OGG เป็น IMA

OGG เป็น GSRT

OGG เป็น SOU

OGG เป็น VMS

OGG เป็น PVF

OGG เป็น SD2

OGG เป็น FSSD

OGG เป็น HCOM

OGG เป็น IRCAM

OGG เป็น CVU

OGG เป็น SPH

OGG เป็น HTK

OGG เป็น TTA

OGG เป็น AVR

OGG เป็น PRC

OGG เป็น MAUD

OGG เป็น SNDR

OGG เป็น SNDT

OGG เป็น CVSD

OGG เป็น DVMS

OGG เป็น FAP

OGG เป็น NIST

ตัวแปลงเฉพาะ

MP3 เป็น SPH

WAV เป็น SPH

MP4 เป็น SPH

ASF เป็น SPH

FLAC เป็น SPH

M4A เป็น SPH

OGG เป็น SPH

SWF เป็น SPH

WVE เป็น SPH

3G2 เป็น SPH

3GP เป็น SPH

AAF เป็น SPH

AV1 เป็น SPH

AVCHD เป็น SPH

AVI เป็น SPH

CAVS เป็น SPH

DIVX เป็น SPH

DV เป็น SPH

F4V เป็น SPH

FLV เป็น SPH

HEVC เป็น SPH

M2TS เป็น SPH

M2V เป็น SPH

M4V เป็น SPH

MJPEG เป็น SPH

MKV เป็น SPH

MOD เป็น SPH

MOV เป็น SPH

MPEG เป็น SPH

MPEG-2 เป็น SPH

OGG ถึง SPH คะแนนคุณภาพ

4.0 (1 คะแนน)

คุณต้องแปลงและดาวน์โหลดไฟล์อย่างน้อย 1 ไฟล์เพื่อให้ข้อเสนอแนะ!