เครื่องมือแปลงไฟล์ NIST เป็น WAV
แปลงไฟล์ nist ของคุณให้เป็น wav ผ่านช่องทางออนไลน์ฟรี
nist
wav
การตั้งค่า
PCM_S16LE (ที่ไม่มีการบีบอัดข้อมูล)
ตัวแปลงสัญญาณเพื่อเข้ารหัสแทร็กเสียงตัวแปลงสัญญาณ "โดยไม่มีการเข้ารหัสใหม่" จะคัดลอกสตรีมเสียงจากไฟล์ขาเข้าไปยังขาออกโดยไม่ต้องเข้ารหัสซ้ำหากเป็นไปได้
อัตโนมัติ (ไม่มีการเปลี่ยนแปลง)
กำหนดจำนวนช่องสัญญาณเสียง การตั้งค่านี้มีประโยชน์มากที่สุดเมื่อทำการลด (ดาวน์มิกซ์) ช่องสัญญาณ (เช่น จาก 5.1 เป็นสเตอริโอ)
อัตโนมัติ (ไม่มีการเปลี่ยนแปลง)
กำหนดอัตราตัวอย่างของเสียง เพลงที่มีคลื่นความถี่เต็มที่ (20 Hz - 20 kHz) ต้องมีค่าไม่ต่ำกว่า 44.1 kHz เพื่อให้เกิดความโปร่งใส สามารถอ่านข้อมูลเพิ่มเติมได้ใน วิกิ
nist
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
อ่านเพิ่มเติม
wav
WAV (Waveform Audio File Format) เป็นคอนเทนเนอร์เสียงแบบไม่บีบอัดที่ Microsoft และ IBM ร่วมกันพัฒนา เผยแพร่ครั้งแรกในเดือนสิงหาคม 1991 พร้อมกับ Windows 3.1 สร้างขึ้นบน Resource Interchange File Format (RIFF) WAV จัดเก็บข้อมูลเสียง — โดยทั่วไปเป็น linear pulse-code modulation (LPCM) — พร้อมเมทาดาทาที่อธิบายอัตราสุ่มตัวอย่าง ความลึกบิต และจำนวนช่องสัญญาณ โครงสร้างที่ตรงไปตรงมานี้ทำให้ WAV เป็นมาตรฐานสำหรับเสียงไม่บีบอัดบน Windows และเป็นรูปแบบแลกเปลี่ยนที่ยอมรับในระดับสากลในระบบปฏิบัติการ โปรแกรมแก้ไขเสียง และเครื่องเล่นสื่อแทบทุกตัว ไฟล์ WAV คุณภาพ CD ใช้ตัวอย่าง 16 บิตที่ 44.1 kHz สเตอริโอ ขณะที่เวิร์กโฟลว์ระดับมืออาชีพมักใช้ตัวอย่าง 24 บิตหรือ 32 บิต float ที่อัตราสูงสุด 192 kHz ข้อดีสำคัญคือความเที่ยงตรงแบบไม่สูญเสีย — เนื่องจาก WAV มาตรฐานไม่ใช้การบีบอัด ข้อมูลที่จัดเก็บจึงเป็นตัวแทนดิจิทัลที่ตรงกับการบันทึกต้นฉบับทุกประการ ทำให้เป็นตัวเลือกที่นิยมสำหรับการมาสเตอร์และการเก็บถาวร WAV ยังรองรับเมทาดาทาแบบฝังผ่าน INFO และ BWF chunks ช่วยให้สามารถบันทึกเวลาและบันทึกการผลิต ข้อแลกเปลี่ยนหลักคือขนาดไฟล์ — เสียงสเตอริโอคุณภาพ CD หนึ่งนาทีใช้พื้นที่ประมาณ 10 MB — และโครงสร้าง RIFF 32 บิตกำหนดขีดจำกัด 4 GB แม้ว่า RF64 จะขจัดข้อจำกัดนั้น
อ่านเพิ่มเติม
วิธีแปลง NIST เป็น WAV
เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.
เลือกรูปแบบไฟล์ wav หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)
ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ wav ของคุณได้หลังจากนั้น
เกี่ยวกับรูปแบบไฟล์
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
WAV (Waveform Audio File Format) เป็นคอนเทนเนอร์เสียงแบบไม่บีบอัดที่ Microsoft และ IBM ร่วมกันพัฒนา เผยแพร่ครั้งแรกในเดือนสิงหาคม 1991 พร้อมกับ Windows 3.1 สร้างขึ้นบน Resource Interchange File Format (RIFF) WAV จัดเก็บข้อมูลเสียง — โดยทั่วไปเป็น linear pulse-code modulation (LPCM) — พร้อมเมทาดาทาที่อธิบายอัตราสุ่มตัวอย่าง ความลึกบิต และจำนวนช่องสัญญาณ โครงสร้างที่ตรงไปตรงมานี้ทำให้ WAV เป็นมาตรฐานสำหรับเสียงไม่บีบอัดบน Windows และเป็นรูปแบบแลกเปลี่ยนที่ยอมรับในระดับสากลในระบบปฏิบัติการ โปรแกรมแก้ไขเสียง และเครื่องเล่นสื่อแทบทุกตัว ไฟล์ WAV คุณภาพ CD ใช้ตัวอย่าง 16 บิตที่ 44.1 kHz สเตอริโอ ขณะที่เวิร์กโฟลว์ระดับมืออาชีพมักใช้ตัวอย่าง 24 บิตหรือ 32 บิต float ที่อัตราสูงสุด 192 kHz ข้อดีสำคัญคือความเที่ยงตรงแบบไม่สูญเสีย — เนื่องจาก WAV มาตรฐานไม่ใช้การบีบอัด ข้อมูลที่จัดเก็บจึงเป็นตัวแทนดิจิทัลที่ตรงกับการบันทึกต้นฉบับทุกประการ ทำให้เป็นตัวเลือกที่นิยมสำหรับการมาสเตอร์และการเก็บถาวร WAV ยังรองรับเมทาดาทาแบบฝังผ่าน INFO และ BWF chunks ช่วยให้สามารถบันทึกเวลาและบันทึกการผลิต ข้อแลกเปลี่ยนหลักคือขนาดไฟล์ — เสียงสเตอริโอคุณภาพ CD หนึ่งนาทีใช้พื้นที่ประมาณ 10 MB — และโครงสร้าง RIFF 32 บิตกำหนดขีดจำกัด 4 GB แม้ว่า RF64 จะขจัดข้อจำกัดนั้น