ตัวแปลง TS เป็น NIST

แยกเสียง NIST Audio จากไฟล์บันทึก TS ออนไลน์

วางไฟล์ต่างๆ​ ที่นี่. 1 GB ขนาดไฟล์สูงสุด หรือ ลงชื่อ
ไปยัง
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

ผลลัพธ์เฉพาะทาง

NIST เป็นรูปแบบสำหรับงานวิจัยการรู้จำเสียงพูด ดึงรูปแบบที่ต้องการจากแหล่ง TS ได้ตรงจุด

ประมวลผลบนคลาวด์

การแยกเสียงทำงานบนเซิร์ฟเวอร์ — ไม่ต้องใช้เครื่องมือเฉพาะบนเครื่องของคุณ

จัดการอย่างปลอดภัย

ไฟล์ TS ที่อัปโหลดจะถูกลบหลังแปลง ไฟล์ NIST จะถูกลบภายใน 24 ชั่วโมง

วิธีแปลง TS เป็น NIST

1

เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.

2

เลือกรูปแบบไฟล์ nist หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)

3

ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ nist ของคุณได้หลังจากนั้น

เกี่ยวกับรูปแบบไฟล์

TS (MPEG Transport Stream) เป็นรูปแบบคอนเทนเนอร์มาตรฐานที่กำหนดเป็นส่วนหนึ่งของชั้นระบบ MPEG-2 (ISO/IEC 13818-1) ได้มาตรฐานโดย Moving Picture Experts Group ในปี 1995 Transport streams ออกแบบมาสำหรับสภาพแวดล้อมการสื่อสารและจัดเก็บที่อาจเกิดการสูญหายหรือเสียหายของข้อมูล เช่น โทรทัศน์ออกอากาศ การส่งผ่านดาวเทียม และการสตรีมผ่านเครือข่าย รูปแบบนี้แบ่งเนื้อหาเป็นแพ็กเก็ตขนาดคงที่ 188 ไบต์ แต่ละแพ็กเก็ตมี header 4 ไบต์ที่มีข้อมูลการซิงโครไนซ์ การบ่งชี้ข้อผิดพลาด และการระบุสตรีม โครงสร้างแพ็กเก็ตนี้ช่วยให้ตัวรับสัญญาณซิงโครไนซ์กลับคืนได้อย่างรวดเร็วหลังจากสัญญาณขัดจังหวะ ซึ่งเป็นความสามารถสำคัญสำหรับการส่งออกอากาศแบบเรียลไทม์ที่แยก transport streams จาก program streams ที่ออกแบบสำหรับสื่อจัดเก็บที่เชื่อถือได้ TS สามารถมัลติเพล็กซ์หลายโปรแกรมในสตรีมเดียว โดยมีตาราง Program Specific Information (PSI) ที่อธิบายโครงสร้างและเนื้อหาของแต่ละโปรแกรม รูปแบบรองรับตัวแปลงสัญญาณเสียงและวิดีโอแทบทุกชนิด แม้จะบรรจุ MPEG-2 video, H.264 หรือ HEVC ควบคู่กับ AAC, AC-3 หรือ MPEG audio เป็นหลัก TS เป็นแกนหลักของการส่งโทรทัศน์ดิจิทัลทั่วโลก ถูกใช้โดยมาตรฐานการออกอากาศ DVB, ATSC และ ISDB รวมถึงบริการสตรีมมิง IPTV และ OTT ที่ใช้ HTTP Live Streaming (HLS) ความทนทาน โครงสร้างที่เป็นมาตรฐาน และการรองรับตัวแปลงสัญญาณอย่างกว้างขวางทำให้ TS เหมาะสมทั้งในระบบออกอากาศสดและขั้นตอนการบันทึกแบบไฟล์
ผู้พัฒนา: Moving Picture Experts Group
เผยแพร่ครั้งแรก: 1995
NIST SPHERE (SPeech HEader REsources) เป็นรูปแบบไฟล์เสียงเฉพาะทางที่สร้างโดย สถาบันมาตรฐานและเทคโนโลยีแห่งชาติ สำหรับการวิจัยเสียงพูด โดยเฉพาะโปรเจกต์ที่ได้รับทุนจาก DARPA รูปแบบนี้ห่อหุ้มตัวอย่างเสียงดิบด้วยส่วนหัว ASCII ที่มีโครงสร้างซึ่งเข้ารหัสเมตาดาต้า เช่น อัตราสุ่มตัวอย่าง จำนวนแชนเนล ประเภทการเข้ารหัส ข้อมูลประชากรผู้พูด และคำอธิบายการถอดความ — เหมาะอย่างยิ่งสำหรับการเผยแพร่คอร์ปัสเสียงพูด ไฟล์ NIST มักเก็บ PCM แบบไม่บีบอัดหรือเสียง mu-law ที่อัตราสุ่มตัวอย่างคุณภาพโทรศัพท์ (8 kHz หรือ 16 kHz) แม้คอนเทนเนอร์จะยืดหยุ่นพอรองรับการเข้ารหัสหลายแบบ ข้อดีสำคัญคือส่วนหัวแบบบันทึกตัวเองที่หลากหลาย ช่วยให้นักวิจัยฝังเมตาดาต้าคอร์ปัสโดยละเอียดในไฟล์โดยตรง ไม่ต้องมีไฟล์ข้างเคียง SPHERE ยังกลายเป็นมาตรฐานที่ใช้จริงสำหรับฐานข้อมูลเสียงพูดหลัก ๆ เช่น TIMIT, Switchboard และคอร์ปัส Fisher รับประกันการรับรู้อย่างกว้างขวางในห้องปฏิบัติการทั้งด้านวิชาการและภาครัฐ ข้อกำหนดแบบเปิดและเครื่องมือบรรทัดคำสั่งที่มีให้ (sphere, h_strip, w_decode) ทำให้สามารถแปลง ตรวจสอบ และประมวลผลไฟล์เหล่านี้ทางโปรแกรมได้อย่างตรงไปตรงมาในไปป์ไลน์ประมวลผลเสียงพูด
เผยแพร่ครั้งแรก: 1990

คำถามที่พบบ่อย

ทำไมต้องแปลง TS เป็น NIST?

NIST เป็นรูปแบบสำหรับงานเปรียบเทียบมาตรฐานการรู้จำเสียงพูด การแปลงจะดึงข้อมูลเสียงที่เข้ากันได้จากไฟล์บันทึก TS

ซอฟต์แวร์อะไรเปิด NIST ได้?

เครื่องมือเสียงเฉพาะทาง SoX และแอปพลิเคชันเฉพาะรูปแบบสามารถจัดการไฟล์ NIST ได้

NIST รองรับทั่วไปไหม?

NIST ใช้ในงานเฉพาะทาง สำหรับเสียงทั่วไป MP3, WAV หรือ FLAC เข้ากันได้กว้างกว่า

ปรับตั้งค่าได้ไหม?

ได้ — กำหนดอัตราสุ่มตัวอย่างและพารามิเตอร์การเข้ารหัสก่อนแปลงให้ตรงกับระบบเป้าหมาย

แปลงเป็นชุดได้ไหม?

อัปโหลดไฟล์ TS หลายไฟล์และแยกเสียง NIST จากแต่ละไฟล์ได้พร้อมกันในเซสชันเดียว