เครื่องมือแปลงไฟล์ NIST เป็น AMR

แปลงไฟล์ nist ของคุณให้เป็น amr ผ่านช่องทางออนไลน์ฟรี

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง

การตั้งค่า

ตัวแปลงสัญญาณเสียง AMR รองรับบิตเรตอย่างหลากหลาย ตั้งแต่ 4.75 ไปจนถึง 12.2 kbit/s ด้วยคุณภาพเสียงเริ่มต้นที่ 7.4 kbit/s
กำหนดจำนวนช่องสัญญาณเสียง การตั้งค่านี้มีประโยชน์มากที่สุดเมื่อทำการลด (ดาวน์มิกซ์) ช่องสัญญาณ (เช่น จาก 5.1 เป็นสเตอริโอ)
กำหนดอัตราตัวอย่างของเสียง เพลงที่มีคลื่นความถี่เต็มที่ (20 Hz - 20 kHz) ต้องมีค่าไม่ต่ำกว่า 44.1 kHz เพื่อให้เกิดความโปร่งใส สามารถอ่านข้อมูลเพิ่มเติมได้ใน วิกิ

nist

NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
อ่านเพิ่มเติม

amr

AMR (Adaptive Multi-Rate) เป็นรูปแบบเสียงบีบอัดที่ปรับให้เหมาะสำหรับเสียงพูด ได้รับมาตรฐานจาก สถาบันมาตรฐานโทรคมนาคมแห่งยุโรป และถูกนำมาใช้เป็นตัวแปลงสัญญาณบังคับสำหรับเครือข่ายมือถือ GSM และ 3G ตัวแปลงสัญญาณสลับบิตเรตแบบไดนามิกระหว่างแปดระดับ — ตั้งแต่ 4.75 ถึง 12.2 kbps — ตามสภาพเครือข่ายและระดับเสียงรบกวนพื้นหลัง เมื่อคุณภาพลิงก์ลดลง ตัวเข้ารหัสจะเปลี่ยนไปใช้อัตราที่ต่ำกว่า แลกความชัดเจนเล็กน้อยกับความเสถียรในการส่งข้อมูล กลไกการปรับตัวนี้กำหนดโดยข้อกำหนด 3GPP และเป็นหนึ่งในตัวแปลงสัญญาณเสียงที่ใช้งานแพร่หลายที่สุดในโลก ใช้ในการโทรมือถือหลายพันล้านครั้ง ข้อดีหลักคือประสิทธิภาพการบีบอัด: เสียง AMR หนึ่งนาทีที่ 12.2 kbps ใช้พื้นที่เพียงประมาณ 90 KB ใช้งานได้จริงสำหรับบันทึกเสียง วอยซ์เมล และ MMS บนเครือข่ายที่มีแบนด์วิดท์จำกัด อีกข้อดีคือมีการตรวจจับกิจกรรมเสียงและการสร้างเสียงรบกวนขณะเงียบในตัว ช่วยลดการส่งข้อมูลระหว่างช่วงเงียบ แม้ AMR จะไม่เหมาะกับเพลงเนื่องจากแบนด์วิดท์แคบ (300-3400 Hz) แต่เชี่ยวชาญในการส่งเสียงพูดที่ชัดเจนภายใต้สภาพเครือข่ายที่ท้าทาย
อ่านเพิ่มเติม
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

วิธีแปลง NIST เป็น AMR

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ amr หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ amr ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990
AMR (Adaptive Multi-Rate) เป็นรูปแบบเสียงบีบอัดที่ปรับให้เหมาะสำหรับเสียงพูด ได้รับมาตรฐานจาก สถาบันมาตรฐานโทรคมนาคมแห่งยุโรป และถูกนำมาใช้เป็นตัวแปลงสัญญาณบังคับสำหรับเครือข่ายมือถือ GSM และ 3G ตัวแปลงสัญญาณสลับบิตเรตแบบไดนามิกระหว่างแปดระดับ — ตั้งแต่ 4.75 ถึง 12.2 kbps — ตามสภาพเครือข่ายและระดับเสียงรบกวนพื้นหลัง เมื่อคุณภาพลิงก์ลดลง ตัวเข้ารหัสจะเปลี่ยนไปใช้อัตราที่ต่ำกว่า แลกความชัดเจนเล็กน้อยกับความเสถียรในการส่งข้อมูล กลไกการปรับตัวนี้กำหนดโดยข้อกำหนด 3GPP และเป็นหนึ่งในตัวแปลงสัญญาณเสียงที่ใช้งานแพร่หลายที่สุดในโลก ใช้ในการโทรมือถือหลายพันล้านครั้ง ข้อดีหลักคือประสิทธิภาพการบีบอัด: เสียง AMR หนึ่งนาทีที่ 12.2 kbps ใช้พื้นที่เพียงประมาณ 90 KB ใช้งานได้จริงสำหรับบันทึกเสียง วอยซ์เมล และ MMS บนเครือข่ายที่มีแบนด์วิดท์จำกัด อีกข้อดีคือมีการตรวจจับกิจกรรมเสียงและการสร้างเสียงรบกวนขณะเงียบในตัว ช่วยลดการส่งข้อมูลระหว่างช่วงเงียบ แม้ AMR จะไม่เหมาะกับเพลงเนื่องจากแบนด์วิดท์แคบ (300-3400 Hz) แต่เชี่ยวชาญในการส่งเสียงพูดที่ชัดเจนภายใต้สภาพเครือข่ายที่ท้าทาย
เผยแพร่ครั้งแรก: 1999