ตัวแปลง WEBM เป็น SPH

แยกเสียง WebM เป็นรูปแบบเสียงพูด NIST SPHERE ออนไลน์

เลือกไฟล์ต่างๆ

วางไฟล์ต่างๆ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ

ไปยัง

วิดีโอเว็บสู่คอร์ปัส

แปลงเสียงวิดีโอ WebM โดยตรงเป็น NIST SPHERE — เปลี่ยนเนื้อหาออนไลน์ที่มีอยู่อย่างอิสระเป็นข้อมูลวิจัยเสียงพูดที่มีโครงสร้าง

มาตรฐาน NIST

เอาต์พุต SPH ตรงตามข้อกำหนด SPHERE ทุกประการ นำเข้าโดยตรงใน Kaldi, HTK หรือเฟรมเวิร์กฝึกการรู้จำเสียงพูดใดก็ได้

ทุกแพลตฟอร์ม

แปลง WebM เป็น SPH จากอุปกรณ์ใดก็ได้ที่มีเบราว์เซอร์ ไม่มีข้อจำกัดแพลตฟอร์ม — เว็บเป็นแหล่ง เครื่องมือของเราเป็นตัวแปลง

วิธีแปลง WEBM เป็น SPH

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

WebM เป็นรูปแบบคอนเทนเนอร์มัลติมีเดียแบบเปิดและปลอดค่าลิขสิทธิ์ที่พัฒนาโดย Google และเปิดตัวในงาน Google I/O ในเดือนพฤษภาคม 2010 รูปแบบนี้จับคู่คอนเทนเนอร์ Matroska (ชุดย่อยของ MKV) กับตัวแปลงสัญญาณวิดีโอ VP8 หรือ VP9 และตัวแปลงสัญญาณเสียง Vorbis หรือ Opus สร้างสแต็กสื่อแบบเปิดอย่างสมบูรณ์ที่ออกแบบเฉพาะสำหรับใช้งานบนเว็บ Google เปิดตัว WebM พร้อมกับตัวแปลงสัญญาณ VP8 ภายใต้ใบอนุญาตแบบ BSD ที่ผ่อนปรน ลบอุปสรรคด้านสิทธิบัตรและค่าลิขสิทธิ์ที่กีดขวางการนำ H.264 มาใช้สำหรับวิดีโอเว็บเปิด คอนเทนเนอร์ WebM สืบทอดโครงสร้างไบนารีที่มีประสิทธิภาพของ Matroska ในขณะที่จำกัดไว้เฉพาะโปรไฟล์ที่ปรับให้เหมาะกับเว็บ ทำให้แยกวิเคราะห์ได้รวดเร็วและใช้งานในเบราว์เซอร์ได้เบา WebM กับ VP9 ให้ประสิทธิภาพการบีบอัดที่แข่งขันได้กับ H.264 High Profile และเข้าใกล้ HEVC ทำให้สามารถส่งวิดีโอคุณภาพสูงที่แบนด์วิดท์ที่ลดลงได้จริง เว็บเบราว์เซอร์หลัก ได้แก่ Chrome, Firefox, Edge และ Opera รองรับการเล่น WebM โดยตรง และ YouTube ใช้ VP9 ใน WebM เป็นรูปแบบการส่งหลักสำหรับเนื้อหาส่วนใหญ่ รูปแบบรองรับฟีเจอร์เช่นช่อง alpha transparency ในวิดีโอ ทำให้มีคุณค่าสำหรับการคอมโพสิตกราฟิกเว็บและโอเวอร์เลย์ เมื่อเร็วๆ นี้ WebM ได้ขยายการรองรับวิดีโอ AV1 เพื่อวิวัฒนาการอย่างต่อเนื่องในฐานะช่องทางสำหรับการนำตัวแปลงสัญญาณเปิดมาใช้ การผสมผสานของการบีบอัดที่แข่งขันได้ ไม่มีค่าใช้จ่ายด้านใบอนุญาต และการรองรับเบราว์เซอร์ทุกค่าย ทำให้ WebM เป็นเสาหลักของการส่งมัลติมีเดียเว็บแบบปลอดค่าลิขสิทธิ์

ผู้พัฒนา: Google

เผยแพร่ครั้งแรก: 19 พฤษภาคม 2010

SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้

ผู้พัฒนา: National Institute of Standards and Technology

เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง WebM เป็น SPH?

SPH เป็นมาตรฐาน NIST สำหรับการวิจัยเสียงพูด วิดีโอ WebM บนเว็บ — บรรยาย พอดแคสต์ การพูด — ให้ข้อมูลเสียงพูดที่หลากหลายสำหรับฝึก ASR

เครื่องมืออะไรรองรับ SPH?

Kaldi, HTK, Praat และชุดเครื่องมือ NIST SPHERE ทั้งหมดรองรับ SPH โดยตรง เป็นมาตรฐานในห้องวิจัยการรู้จำเสียงพูด

SPH บีบอัดเสียงไหม?

ไม่ — SPH จัดเก็บ PCM โดยไม่มีการบีบอัดสูญเสีย เสียง WebM จะถูกถอดรหัสและจัดเก็บที่คุณภาพเต็มสำหรับการวิเคราะห์เสียงพูดที่แม่นยำ

WebM เป็นแหล่งข้อมูลเสียงพูดที่ดีไหม?

WebM เป็นรูปแบบวิดีโอเว็บมาตรฐาน วิดีโอการศึกษาและการบรรยายที่บันทึกใน WebM มีข้อมูลเสียงพูดที่อุดมสมบูรณ์สำหรับใช้ในงานวิจัย

แปลงเป็นชุดได้ไหม?

อัปโหลดวิดีโอ WebM หลายไฟล์และแปลงเป็น SPH พร้อมกัน มีประสิทธิภาพสำหรับสร้างคอร์ปัสเสียงพูดจากคอลเลกชันวิดีโอเว็บ

การแปลงที่เกี่ยวข้อง

WEBM เป็น MP4

WEBM เป็น MP3

WEBM เป็น GIF

WEBM เป็น AVI

WEBM เป็น WAV

WEBM เป็น WMV

WEBM เป็น MPEG

WEBM เป็น MOV

WEBM เป็น M4A

WEBM เป็น MPG

WEBM เป็น OGG

WEBM เป็น FLAC

WEBM เป็น MKV

WEBM เป็น DIVX

WEBM เป็น WMA

WEBM เป็น M4V

WEBM เป็น 3GP

WEBM เป็น OGV

WEBM เป็น FLV

WEBM เป็น AAC

WEBM เป็น SWF

WEBM เป็น VOB

WEBM เป็น AV1

WEBM เป็น HEVC

WEBM เป็น M4R

WEBM เป็น MP2

WEBM เป็น MJPEG

WEBM เป็น XVID

WEBM เป็น OPUS

WEBM เป็น AIFF

WEBM เป็น TS

WEBM เป็น AVCHD

WEBM เป็น ASF

WEBM เป็น RMVB

WEBM เป็น CDDA

WEBM เป็น MTS

WEBM เป็น MPEG-2

WEBM เป็น MXF

WEBM เป็น AMR

WEBM เป็น AC3

WEBM เป็น F4V

WEBM เป็น RM

WEBM เป็น 3G2

WEBM เป็น DTS

WEBM เป็น M2TS

WEBM เป็น M2V

WEBM เป็น WTV

WEBM เป็น AVR

WEBM เป็น W64

WEBM เป็น WVE

WEBM เป็น 8SVX

WEBM เป็น AU

WEBM เป็น WV

WEBM เป็น SMP

WEBM เป็น CAF

WEBM เป็น HCOM

WEBM เป็น IRCAM

WEBM เป็น SPX

WEBM เป็น IMA

WEBM เป็น CVSD

ตัวแปลงเฉพาะ

MP3 เป็น SPH

WAV เป็น SPH

MP4 เป็น SPH

ASF เป็น SPH

FLAC เป็น SPH

M4A เป็น SPH

OGG เป็น SPH

SWF เป็น SPH

WVE เป็น SPH

3G2 เป็น SPH

3GP เป็น SPH

AAF เป็น SPH

AV1 เป็น SPH

AVCHD เป็น SPH

AVI เป็น SPH

CAVS เป็น SPH

DIVX เป็น SPH

DV เป็น SPH

F4V เป็น SPH

FLV เป็น SPH

HEVC เป็น SPH

M2TS เป็น SPH

M2V เป็น SPH

M4V เป็น SPH

MJPEG เป็น SPH

MKV เป็น SPH

MOD เป็น SPH

MOV เป็น SPH

MPEG เป็น SPH

MPEG-2 เป็น SPH