ตัวแปลง WEBM เป็น SPH

แยกเสียง WebM เป็นรูปแบบเสียงพูด NIST SPHERE ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิดีโอเว็บสู่คอร์ปัส

แปลงเสียงวิดีโอ WebM โดยตรงเป็น NIST SPHERE — เปลี่ยนเนื้อหาออนไลน์ที่มีอยู่อย่างอิสระเป็นข้อมูลวิจัยเสียงพูดที่มีโครงสร้าง

มาตรฐาน NIST

เอาต์พุต SPH ตรงตามข้อกำหนด SPHERE ทุกประการ นำเข้าโดยตรงใน Kaldi, HTK หรือเฟรมเวิร์กฝึกการรู้จำเสียงพูดใดก็ได้

ทุกแพลตฟอร์ม

แปลง WebM เป็น SPH จากอุปกรณ์ใดก็ได้ที่มีเบราว์เซอร์ ไม่มีข้อจำกัดแพลตฟอร์ม — เว็บเป็นแหล่ง เครื่องมือของเราเป็นตัวแปลง

วิธีแปลง WEBM เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

WebM เป็นรูปแบบคอนเทนเนอร์มัลติมีเดียแบบเปิดและปลอดค่าลิขสิทธิ์ที่พัฒนาโดย Google และเปิดตัวในงาน Google I/O ในเดือนพฤษภาคม 2010 รูปแบบนี้จับคู่คอนเทนเนอร์ Matroska (ชุดย่อยของ MKV) กับตัวแปลงสัญญาณวิดีโอ VP8 หรือ VP9 และตัวแปลงสัญญาณเสียง Vorbis หรือ Opus สร้างสแต็กสื่อแบบเปิดอย่างสมบูรณ์ที่ออกแบบเฉพาะสำหรับใช้งานบนเว็บ Google เปิดตัว WebM พร้อมกับตัวแปลงสัญญาณ VP8 ภายใต้ใบอนุญาตแบบ BSD ที่ผ่อนปรน ลบอุปสรรคด้านสิทธิบัตรและค่าลิขสิทธิ์ที่กีดขวางการนำ H.264 มาใช้สำหรับวิดีโอเว็บเปิด คอนเทนเนอร์ WebM สืบทอดโครงสร้างไบนารีที่มีประสิทธิภาพของ Matroska ในขณะที่จำกัดไว้เฉพาะโปรไฟล์ที่ปรับให้เหมาะกับเว็บ ทำให้แยกวิเคราะห์ได้รวดเร็วและใช้งานในเบราว์เซอร์ได้เบา WebM กับ VP9 ให้ประสิทธิภาพการบีบอัดที่แข่งขันได้กับ H.264 High Profile และเข้าใกล้ HEVC ทำให้สามารถส่งวิดีโอคุณภาพสูงที่แบนด์วิดท์ที่ลดลงได้จริง เว็บเบราว์เซอร์หลัก ได้แก่ Chrome, Firefox, Edge และ Opera รองรับการเล่น WebM โดยตรง และ YouTube ใช้ VP9 ใน WebM เป็นรูปแบบการส่งหลักสำหรับเนื้อหาส่วนใหญ่ รูปแบบรองรับฟีเจอร์เช่นช่อง alpha transparency ในวิดีโอ ทำให้มีคุณค่าสำหรับการคอมโพสิตกราฟิกเว็บและโอเวอร์เลย์ เมื่อเร็วๆ นี้ WebM ได้ขยายการรองรับวิดีโอ AV1 เพื่อวิวัฒนาการอย่างต่อเนื่องในฐานะช่องทางสำหรับการนำตัวแปลงสัญญาณเปิดมาใช้ การผสมผสานของการบีบอัดที่แข่งขันได้ ไม่มีค่าใช้จ่ายด้านใบอนุญาต และการรองรับเบราว์เซอร์ทุกค่าย ทำให้ WebM เป็นเสาหลักของการส่งมัลติมีเดียเว็บแบบปลอดค่าลิขสิทธิ์
ผู้พัฒนา: Google
เผยแพร่ครั้งแรก: 19 พฤษภาคม 2010
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง WebM เป็น SPH?

SPH เป็นมาตรฐาน NIST สำหรับการวิจัยเสียงพูด วิดีโอ WebM บนเว็บ — บรรยาย พอดแคสต์ การพูด — ให้ข้อมูลเสียงพูดที่หลากหลายสำหรับฝึก ASR

เครื่องมืออะไรรองรับ SPH?

Kaldi, HTK, Praat และชุดเครื่องมือ NIST SPHERE ทั้งหมดรองรับ SPH โดยตรง เป็นมาตรฐานในห้องวิจัยการรู้จำเสียงพูด

SPH บีบอัดเสียงไหม?

ไม่ — SPH จัดเก็บ PCM โดยไม่มีการบีบอัดสูญเสีย เสียง WebM จะถูกถอดรหัสและจัดเก็บที่คุณภาพเต็มสำหรับการวิเคราะห์เสียงพูดที่แม่นยำ

WebM เป็นแหล่งข้อมูลเสียงพูดที่ดีไหม?

WebM เป็นรูปแบบวิดีโอเว็บมาตรฐาน วิดีโอการศึกษาและการบรรยายที่บันทึกใน WebM มีข้อมูลเสียงพูดที่อุดมสมบูรณ์สำหรับใช้ในงานวิจัย

แปลงเป็นชุดได้ไหม?

อัปโหลดวิดีโอ WebM หลายไฟล์และแปลงเป็น SPH พร้อมกัน มีประสิทธิภาพสำหรับสร้างคอร์ปัสเสียงพูดจากคอลเลกชันวิดีโอเว็บ