ตัวแปลง AVCHD เป็น SPH

ดึงรูปแบบ NIST SPHERE จากวิดีโอกล้อง AVCHD

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

มาตรฐานวิจัย

SPH เป็นมาตรฐาน NIST สำหรับวิจัยเสียงพูด ดึงเสียง AVCHD สำหรับวิเคราะห์ภาษาศาสตร์

Metadata หลากหลาย

รูปแบบ SPHERE มี metadata การบันทึกอย่างละเอียด — บริบทที่มีค่าจากแหล่ง AVCHD

ดึงบนคลาวด์

การดึง SPH จาก AVCHD ทำงานบนเซิร์ฟเวอร์ — ไม่ต้องมีเครื่องมือ NIST บนเครื่อง

วิธีแปลง AVCHD เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

AVCHD (Advanced Video Coding High Definition) เป็นรูปแบบบันทึกความละเอียดสูงที่พัฒนาร่วมกันโดย Sony และ Panasonic สำหรับใช้ในกล้องวิดีโอระดับผู้บริโภคและกึ่งมืออาชีพ ประกาศเปิดตัวในปี 2006 รูปแบบนี้บันทึกวิดีโอ H.264/MPEG-4 AVC ที่ความละเอียดสูงสุด 1920x1080 พร้อมเสียง Dolby Digital หรือ LPCM แบบไม่บีบอัด จัดเก็บภายในคอนเทนเนอร์ MPEG-2 transport stream AVCHD ออกแบบมาเพื่อทำงานกับสื่อบันทึกหลากหลายประเภท ทั้งแผ่นออปติคัล ฮาร์ดดิสก์ และการ์ดหน่วยความจำ solid-state ให้ผู้ผลิตกล้องมีความยืดหยุ่นในการออกแบบฮาร์ดแวร์ การใช้การบีบอัด H.264 ให้คุณภาพภาพที่เหนือกว่าที่บิตเรตต่ำกว่าเมื่อเทียบกับมาตรฐานการบันทึกรุ่นก่อนอย่าง DV และ MPEG-2 ทำให้บันทึกได้ยาวนานขึ้นบนพื้นที่จัดเก็บเท่าเดิม AVCHD รองรับทั้งโหมดสแกนแบบ progressive และ interlaced เพื่อรองรับทั้งการถ่ายแบบภาพยนตร์และแบบออกอากาศ โครงสร้างไดเรกทอรีเป็นไปตามข้อกำหนดที่เข้มงวดซึ่งรวมถึงไฟล์เพลย์ลิสต์สำหรับนำทางคลิปที่บันทึกไว้ ทำให้เข้ากันได้กับเครื่องเล่น Blu-ray เมื่อบันทึกลงแผ่นที่รองรับ เวอร์ชันปรับปรุง AVCHD 2.0 เพิ่มการรองรับการบันทึก 1080/60p แบบ progressive และวิดีโอ 3D แบบสเตอริโอสโคปิก รูปแบบนี้ยังคงใช้อย่างแพร่หลายในตลาดกล้องวิดีโอและได้รับการรองรับจากแอปพลิเคชันตัดต่อวิดีโอหลักๆ อย่างต่อเนื่อง
ผู้พัฒนา: Sony & Panasonic
เผยแพร่ครั้งแรก: มิถุนายน 2006
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง AVCHD เป็น SPH?

SPHERE (SPH) เป็นรูปแบบเสียงมาตรฐานสำหรับวิจัยเสียงพูดของ NIST — จำเป็นสำหรับคลังข้อมูลภาษาศาสตร์

อะไรใช้ไฟล์ SPH?

แคมเปญประเมินเสียงพูดของ NIST, คลังข้อมูล Linguistic Data Consortium และงานวิจัยการรู้จำเสียงพูดใช้ SPH

SPH ใช้งานร่วมกันได้กว้างไหม?

SPH เฉพาะสำหรับวิจัยเสียงพูด SOX, เครื่องมือ NIST และ Kaldi รองรับไฟล์ SPH

SPH มี metadata อะไรบ้าง?

ส่วนหัว SPHERE มี metadata เกี่ยวกับสภาพการบันทึก ข้อมูลผู้พูด และรายละเอียดแชนเนล

แปลงเป็นชุดได้ไหม?

อัปโหลดไฟล์ AVCHD หลายไฟล์แล้วดึงเสียง SPH พร้อมกันสำหรับสร้างคลังเสียงพูด