ตัวแปลง FLAC เป็น SPH

สร้างไฟล์เสียงพูด SPHERE จาก FLAC แบบไม่สูญเสียคุณภาพ

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ข้อมูลวิจัยที่บริสุทธิ์

FLAC แบบไม่สูญเสียคุณภาพให้ speech corpus ด้วยอินพุตคุณภาพสูงสุด — ข้อมูลฝึก ASR ที่ดีกว่า

มาตรฐาน Corpus

SPH คือสิ่งที่ชุดเครื่องมือเสียงพูดต้องการ — สร้างจากต้นฉบับ FLAC แบบไม่สูญเสียคุณภาพ

ประมวลผลชุดข้อมูล

แปลงคอลเลกชัน FLAC ทั้งหมดเป็น SPH พร้อมกัน

วิธีแปลง FLAC เป็น SPH

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ sph หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ sph ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

FLAC (Free Lossless Audio Codec) ส่งมอบการสร้างเสียงที่สมบูรณ์แบบทางคณิตศาสตร์ที่ขนาดประมาณครึ่งหนึ่งของไฟล์ WAV แบบไม่บีบอัด ดูแลโดย Xiph.Org Foundation และเผยแพร่ในปี 2001 จึงกลายเป็นมาตรฐานเปิดที่ใช้กันทั่วไปสำหรับการจัดเก็บเพลงแบบไม่สูญเสียข้อมูลอย่างรวดเร็ว ตัวเข้ารหัสใช้ linear prediction เพื่อสร้างแบบจำลองแต่ละบล็อกเสียง จากนั้นเข้ารหัสค่าเศษเหลือผ่าน Rice partitioning — ใช้ประโยชน์จากการกระจายทางสถิติของข้อผิดพลาดในการทำนายเพื่อการบีบอัดที่แข็งแกร่งโดยไม่ทิ้งข้อมูล รองรับความลึกบิตสูงสุด 32 และอัตราสุ่มตัวอย่างสูงสุด 655 kHz เกินความต้องการของการบันทึกความละเอียดสูง การรองรับฮาร์ดแวร์มีอย่างกว้างขวาง: สมาร์ทโฟน สเตอริโอรถยนต์ เครื่องเล่น Blu-ray และแอปพลิเคชันสื่อเดสก์ท็อปแทบทุกตัวถอดรหัส FLAC ได้โดยตรง บริการสตรีมมิ่ง เช่น Tidal และ Amazon Music ใช้ FLAC สำหรับระดับไม่สูญเสียข้อมูล ตอกย้ำความไว้วางใจจากอุตสาหกรรมในตัวแปลงสัญญาณนี้ ข้อดีสามประการทำให้ FLAC น่าสนใจ ประการแรก การกู้คืนสัญญาณต้นฉบับ bit-for-bit อย่างสมบูรณ์เมื่อถอดรหัส ประการที่สอง เมตาดาต้าแบบฝังผ่าน Vorbis comments และภาพอัลบั้มช่วยจัดระเบียบคลังเพลงโดยไม่ต้องมีไฟล์ข้างเคียง ประการที่สาม ใบอนุญาตแบบโอเพนซอร์สหมายความว่าไม่มีสิทธิบัตรหรือค่าลิขสิทธิ์ ลดความขัดแย้งทางกฎหมายสำหรับนักพัฒนาและผู้ผลิตฮาร์ดแวร์
ผู้พัฒนา: Xiph.Org Foundation
เผยแพร่ครั้งแรก: 20 กรกฎาคม 2001
SPH เป็นนามสกุลไฟล์สำหรับเสียงที่จัดเก็บในรูปแบบ NIST SPHERE (SPeech HEader REsources) มาตรฐานที่สร้างโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐอเมริการาวปี 1990 สร้างขึ้นสำหรับการวิจัยด้านเสียงพูด ไฟล์ SPH มีส่วนหัว ASCII ขนาด 1024 ไบต์ที่บรรจุเมทาดาทา — ตัวระบุฐานข้อมูล จำนวนช่องสัญญาณ อัตราสุ่มตัวอย่าง ลำดับไบต์ และประเภทการบีบอัด — ทำให้ทุกการบันทึกอธิบายตัวเองได้ เสียงพื้นฐานโดยทั่วไปเป็น PCM เชิงเส้น 16 บิตที่สุ่มตัวอย่าง 16 kHz แม้ว่าจะอนุญาตให้ใช้การกำหนดค่าอื่นได้ นักวิจัยที่ NIST, DARPA และมหาวิทยาลัยทั่วโลกพึ่งพา SPH สำหรับการเผยแพร่คลังเสียงพูดเช่น TIMIT, Switchboard และคอลเลกชัน LDC ที่เป็นรากฐานของระบบการรู้จำเสียงพูดอัตโนมัติสมัยใหม่ ข้อดีสำคัญคือส่วนหัวที่อ่านได้ด้วยมนุษย์ ทำให้สคริปต์สามารถแยกวิเคราะห์เมทาดาทาการบันทึกได้โดยไม่ต้องถอดรหัสไบนารี การกำหนดมาตรฐานที่เข้มงวดของรูปแบบยังขจัดความกำกวมเมื่อแชร์ชุดข้อมูลข้ามสถาบันและแพลตฟอร์ม เนื่องจากไฟล์ SPH จัดเก็บ PCM แบบไม่บีบอัด จึงรักษาความเที่ยงตรงของเสียงอย่างเต็มที่ — สิ่งสำคัญอย่างยิ่งเมื่อฝึกแบบจำลองอะคูสติกที่แม้แต่สิ่งแปลกปลอมเล็กน้อยก็อาจบิดเบือนผลลัพธ์ได้
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง FLAC เป็น SPH?

SPH (SPHERE) คือมาตรฐาน NIST สำหรับ speech corpus FLAC แบบไม่สูญเสียคุณภาพให้ต้นฉบับที่ดีที่สุดสำหรับข้อมูลวิจัยที่แม่นยำ

อะไรใช้ SPH?

Kaldi, HTK, เครื่องมือประเมิน NIST และ speech research corpus ใช้รูปแบบ SPHERE

SPH เหมือน NIST ไหม?

ใช่ — ทั้งคู่หมายถึง SPHERE ที่กำหนดโดย National Institute of Standards and Technology

FLAC ปรับปรุงข้อมูลวิจัยได้ไหม?

ใช่ — ต้นฉบับแบบไม่สูญเสียคุณภาพช่วยให้ข้อมูลเสียงพูดในไฟล์ SPH ปราศจากสัญญาณรบกวนจากการบีบอัด

แปลงหลายไฟล์พร้อมกันได้ไหม?

อัปโหลดคอลเลกชันเสียงพูด FLAC ทั้งหมดและสร้าง SPH สำหรับทุกไฟล์พร้อมกัน

FLAC ถึง SPH คะแนนคุณภาพ

5.0 (1 คะแนน)
คุณต้องแปลงและดาวน์โหลดไฟล์อย่างน้อย 1 ไฟล์เพื่อให้ข้อเสนอแนะ!