محول HTK إلى CVU

يمكنك تحويل ملفات htk إلى cvu على الإنترنت وبشكل مجاني

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

كيفية تحويل HTK إلى CVU

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة cvu أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة cvu فِيما بعد

عن الصيغ

HTK هو حاوية أشكال موجية أصلية لـ حزمة أدوات نموذج ماركوف المخفي، وهي مجموعة برمجيات طُوّرت في قسم الهندسة بجامعة كامبريدج لأبحاث التعرف على الكلام. وُزّعت لأول مرة عام 1993، وأصبحت HTK سريعاً منصة مرجعية في مختبرات اللسانيات الحاسوبية حول العالم، وتبعها تنسيق الملفات الخاص بها. يخزّن كل ملف تسلسلاً من متجهات المعاملات أو العينات الخام مسبوقاً بترويسة من 12 بايت تحدد عدد الإطارات وفترة الإطار بوحدات 100 نانوثانية وعدد البايتات لكل إطار ورمز نوع يشير إلى طبيعة البيانات — تتراوح الخيارات من PCM للشكل الموجي إلى معاملات MFCC وطاقات مصفاة الترشيح. هذا التنوع يتيح لحاوية واحدة حمل كل من الصوت المصدر والميزات المستخلصة دون تغيير المحللات. تتجنب الترويسة المختصرة عمداً حشو المحاذاة أو الكتل الاختيارية، مما يجعل التنسيق سهل القراءة من C أو Python أو MATLAB ببضعة أسطر من الإدخال/الإخراج الثنائي. ثلاث مزايا تدعم أهمية HTK المستمرة: التكامل الوثيق مع خط أنابيب التدريب والتعرف في HTK، والتخطيط الحتمي للبايتات الذي يزيل غموض التحليل، والاعتماد الواسع في المدونات الأكاديمية.
الإصدار الأول: 1993
CVU هو متغير غير موقّع من تنسيق CVS الصوتي الهاتفي، ويختلف في كيفية تمثيل القيم المرمّزة بدلتا في التدفق الثنائي. بينما يخزّن CVS قيم ميلان دلتا كميات موقّعة، يعاملها CVU كقيم غير موقّعة، مما يغيّر التفسير الرقمي لكل عينة. يشترك كلاهما في تقنية تعديل CVSD الأساسية — ترميز دلتا تكيفي أحادي البت حيث يتغير حجم الخطوة وفقاً لأنماط البتات الأخيرة — ويعمل بمعدلات مماثلة، عادةً 16 كيلوبت/ثانية للصوت ضيق النطاق عند 8 كيلوهرتز. يُحدث الفرق بين القيم الموقّعة وغير الموقّعة تأثيره عند فك الترميز، حيث يحدد التفسير الصحيح إعادة البناء السليم للشكل الموجي. تظهر ملفات CVU في سياقات الاتصالات الهاتفية والمدمجة حيث اعتمد العتاد على النمط غير الموقّع. من مزاياه العملية سهولة التواصل مع الأنظمة التي تستخدم الحساب غير الموقّع أصلياً، مما يتجنب توسيع الإشارة في أجهزة فك الترميز. مثل نظيره الموقّع، يحقق CVU كفاءة فائقة في النطاق الترددي، حيث يضغط الصوت في تدفقات بت مضغوطة للروابط المحدودة. يدعم SoX تنسيق CVU، مما يوفر مساراً موثوقاً لتحويل هذه التسجيلات الهاتفية المتخصصة إلى تنسيقات حديثة للتحليل أو الأرشفة.
المطوّر: CCITT / ITU-T
الإصدار الأول: 1970