เครื่องมือแปลงไฟล์ HTK เป็น WV
แปลงไฟล์ htk ของคุณให้เป็น wv ผ่านช่องทางออนไลน์ฟรี
htk
wv
การตั้งค่า
อัตโนมัติ (ไม่มีการเปลี่ยนแปลง)
กำหนดจำนวนช่องสัญญาณเสียง การตั้งค่านี้มีประโยชน์มากที่สุดเมื่อทำการลด (ดาวน์มิกซ์) ช่องสัญญาณ (เช่น จาก 5.1 เป็นสเตอริโอ)
อัตโนมัติ (ไม่มีการเปลี่ยนแปลง)
กำหนดอัตราตัวอย่างของเสียง เพลงที่มีคลื่นความถี่เต็มที่ (20 Hz - 20 kHz) ต้องมีค่าไม่ต่ำกว่า 44.1 kHz เพื่อให้เกิดความโปร่งใส สามารถอ่านข้อมูลเพิ่มเติมได้ใน วิกิ
ไม่มีการเปลี่ยนแปลง
ปรับระดับเสียงโดยเลือกจำนวนเดซิเบล ตัวอย่างเช่น -10 dB ลดระดับเสียงลง 10 เดซิเบล
htk
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
อ่านเพิ่มเติม
wv
WavPack เป็นโคเดกเสียงโอเพนซอร์สที่สร้างโดย David Bryant โดยเวอร์ชัน 1.0 เปิดตัวเมื่อวันที่ 15 สิงหาคม 1998 สิ่งที่ทำให้ WavPack โดดเด่นคือโหมดไฮบริดที่ไม่เหมือนใคร — ตัวเข้ารหัสสามารถสร้างไฟล์แบบสูญเสียคุณภาพขนาดกะทัดรัดและไฟล์แก้ไขแยกต่างหากพร้อมกัน ซึ่งเมื่อรวมกันจะสร้างสตรีม PCM ต้นฉบับขึ้นมาใหม่ได้อย่างถูกต้องทุกบิต ผู้ใช้ที่ต้องการความพกพาใช้เฉพาะไฟล์แบบสูญเสียคุณภาพ ส่วนผู้ที่ต้องการคุณภาพเก็บถาวรจะเก็บทั้งสองไฟล์ โคเดกจัดการเสียง PCM ตั้งแต่ 8 บิตถึง 32 บิตจำนวนเต็มและ 32 บิต floating point พร้อมอัตราสุ่มตัวอย่างสูงสุด 768 kHz — ข้อกำหนดที่กว้างพอสำหรับเนื้อหา DSD ซึ่ง WavPack 5 เพิ่มการรองรับ อัตราส่วนการบีบอัดในโหมดไม่สูญเสียคุณภาพล้วนโดยทั่วไปอยู่ที่ 40 ถึง 55 เปอร์เซ็นต์ของขนาดต้นฉบับ แข่งขันกับ FLAC และมักจะดีกว่าเล็กน้อยในบางวัสดุ การเข้ารหัสแบบหลายคอร์ในเวอร์ชันหลังช่วยเร่งการประมวลผลอย่างมากบนฮาร์ดแวร์สมัยใหม่ ไลบรารีโอเพนซอร์สเผยแพร่ภายใต้สัญญาอนุญาต BSD และถูกผสานรวมเข้ากับ foobar2000, VLC, FFmpeg และเครื่องมืออื่นๆ อีกมากมาย WavPack ยังรองรับเมทาดาทาที่หลากหลายผ่านแท็ก APEv2 embedded cue sheet และค่า ReplayGain ครอบคลุมความต้องการด้านการจัดระเบียบของไลบรารีเพลงที่พิถีพิถันที่สุด
อ่านเพิ่มเติม
วิธีแปลง HTK เป็น WV
เลือกไฟล์จากคอมพิวเตอร์, Google Drive, Dropbox, URL หรือทำการลากไฟล์มาที่หน้า.
เลือกรูปแบบไฟล์ wv หรือรูปแบบไฟล์อื่นตามต้องการเป็นผลลัพธ์(รองรับรูปแบบไฟล์มากกว่า 200 รูปแบบ)
ปล่อยให้แปลงไฟล์และคุณสามารถดาวน์โหลดไฟล์ wv ของคุณได้หลังจากนั้น
เกี่ยวกับรูปแบบไฟล์
HTK เป็นคอนเทนเนอร์รูปคลื่นดั้งเดิมของ Hidden Markov Model Toolkit ชุดซอฟต์แวร์ที่พัฒนาที่ภาควิชาวิศวกรรมของมหาวิทยาลัยเคมบริดจ์สำหรับการวิจัยด้านการรู้จำเสียงพูด เผยแพร่ครั้งแรกในปี 1993 HTK กลายเป็นแพลตฟอร์มอ้างอิงในห้องปฏิบัติการภาษาศาสตร์คอมพิวเตอร์ทั่วโลกอย่างรวดเร็ว และรูปแบบไฟล์ก็ได้รับความนิยมตามไปด้วย แต่ละไฟล์เก็บลำดับเวกเตอร์พารามิเตอร์หรือตัวอย่างดิบนำหน้าด้วยส่วนหัว 12 ไบต์ที่ระบุจำนวนเฟรม คาบเฟรมในหน่วย 100 ns จำนวนไบต์ต่อเฟรม และรหัสประเภทที่ระบุชนิดข้อมูล — ตัวเลือกมีตั้งแต่ waveform PCM ไปจนถึง Mel-frequency cepstral coefficients และพลังงาน filter-bank ความอเนกประสงค์นี้ช่วยให้คอนเทนเนอร์เดียวบรรจุทั้งเสียงต้นทางและคุณลักษณะที่สกัดออกมาโดยไม่ต้องเปลี่ยนตัวแยกวิเคราะห์ ส่วนหัวที่เรียบง่ายอย่างจงใจหลีกเลี่ยง alignment padding หรือ optional chunks ทำให้อ่านรูปแบบจาก C, Python หรือ MATLAB ได้ง่ายด้วยโค้ดไบนารี I/O เพียงไม่กี่บรรทัด ข้อดีสามประการที่สนับสนุนความเกี่ยวข้องอย่างต่อเนื่องของ HTK: การผสานรวมอย่างแน่นแฟ้นกับไปป์ไลน์ฝึกอบรมและรู้จำของ HTK เลย์เอาต์ไบต์ที่แน่นอนซึ่งขจัดความคลุมเครือของตัวแยกวิเคราะห์ และการนำไปใช้อย่างแพร่หลายในคอร์ปัสทางวิชาการ
WavPack เป็นโคเดกเสียงโอเพนซอร์สที่สร้างโดย David Bryant โดยเวอร์ชัน 1.0 เปิดตัวเมื่อวันที่ 15 สิงหาคม 1998 สิ่งที่ทำให้ WavPack โดดเด่นคือโหมดไฮบริดที่ไม่เหมือนใคร — ตัวเข้ารหัสสามารถสร้างไฟล์แบบสูญเสียคุณภาพขนาดกะทัดรัดและไฟล์แก้ไขแยกต่างหากพร้อมกัน ซึ่งเมื่อรวมกันจะสร้างสตรีม PCM ต้นฉบับขึ้นมาใหม่ได้อย่างถูกต้องทุกบิต ผู้ใช้ที่ต้องการความพกพาใช้เฉพาะไฟล์แบบสูญเสียคุณภาพ ส่วนผู้ที่ต้องการคุณภาพเก็บถาวรจะเก็บทั้งสองไฟล์ โคเดกจัดการเสียง PCM ตั้งแต่ 8 บิตถึง 32 บิตจำนวนเต็มและ 32 บิต floating point พร้อมอัตราสุ่มตัวอย่างสูงสุด 768 kHz — ข้อกำหนดที่กว้างพอสำหรับเนื้อหา DSD ซึ่ง WavPack 5 เพิ่มการรองรับ อัตราส่วนการบีบอัดในโหมดไม่สูญเสียคุณภาพล้วนโดยทั่วไปอยู่ที่ 40 ถึง 55 เปอร์เซ็นต์ของขนาดต้นฉบับ แข่งขันกับ FLAC และมักจะดีกว่าเล็กน้อยในบางวัสดุ การเข้ารหัสแบบหลายคอร์ในเวอร์ชันหลังช่วยเร่งการประมวลผลอย่างมากบนฮาร์ดแวร์สมัยใหม่ ไลบรารีโอเพนซอร์สเผยแพร่ภายใต้สัญญาอนุญาต BSD และถูกผสานรวมเข้ากับ foobar2000, VLC, FFmpeg และเครื่องมืออื่นๆ อีกมากมาย WavPack ยังรองรับเมทาดาทาที่หลากหลายผ่านแท็ก APEv2 embedded cue sheet และค่า ReplayGain ครอบคลุมความต้องการด้านการจัดระเบียบของไลบรารีเพลงที่พิถีพิถันที่สุด