محوّل VOB إلى HTK

استخرج صوت DVD من VOB بصيغة HTK للكلام أونلاين

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

من DVD إلى بيانات كلام

استخرج الحوار من ملفات DVD VOB واحفظه كـ HTK — جاهز لتدريب نماذج ماركوف المخفية وأبحاث التحليل الصوتي.

استخراج على الخوادم

قد تكون ملفات VOB كبيرة. خوادمنا تتعامل مع الاستخراج وترميز HTK — بدون الحاجة لتثبيت أدوات محلية.

حماية البيانات

تُحذف ملفات VOB المرفوعة بعد التحويل. تُزال مخرجات HTK خلال 24 ساعة — بيانات بحثك الكلامية تبقى خاصة.

كيفية تحويل VOB إلى HTK

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة htk أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة htk فِيما بعد

عن الصيغ

VOB (كائن الفيديو) هي صيغة الحاوية الأساسية المستخدمة على أقراص DVD-Video، محددة كجزء من مواصفات DVD التي طورها منتدى DVD. ظهرت الصيغة لأول مرة مع معيار DVD الذي اكتمل في سبتمبر 1996 واستُخدمت منذ ذلك الحين على مليارات أقراص DVD المنتجة حول العالم. تستند ملفات VOB إلى صيغة تدفق برنامج MPEG-2، وتحتوي على فيديو MPEG-2 ممزوج مع صوت بترميزات AC-3 (Dolby Digital) أو DTS أو MPEG-1 Layer II أو LPCM. بالإضافة إلى الصوت والفيديو، تحمل ملفات VOB أيضاً تدفقات ترجمة DVD كتراكبات نقطية وبيانات تنقل للتفاعل مع القوائم ومعلومات نقاط الفصول. تتواجد الملفات في دليل VIDEO_TS على قرص DVD، مع اصطلاحات تسمية (VTS_01_1.VOB، إلخ) تعكس هيكل العنوان والجزء للمحتوى. تقتصر ملفات VOB الفردية على حوالي 1 جيجابايت لاستيعاب متطلبات نظام ملفات UDF، مع امتداد المحتوى الأطول عبر ملفات متعددة بسلاسة. تدعم الصيغة دقة فيديو NTSC (720x480) وPAL (720x576) بمعدلات بت تصل إلى 9.8 ميغابت في الثانية للصوت والفيديو مجتمعين. جعل دمج الفيديو والصوت متعدد المسارات والترجمات والتنقل في تدفق برنامج واحد VOB حلاً متكاملاً لتوصيل الأفلام للمستهلك. رغم أن البث وصيغ الأقراص الأحدث حلت محل DVD للمحتوى الجديد، تظل VOB ذات صلة كبيرة للوصول إلى المكتبة الضخمة من محتوى DVD الحالي.
المطوّر: DVD Forum
الإصدار الأول: سبتمبر ١٩٩٦
HTK هو حاوية أشكال موجية أصلية لـ حزمة أدوات نموذج ماركوف المخفي، وهي مجموعة برمجيات طُوّرت في قسم الهندسة بجامعة كامبريدج لأبحاث التعرف على الكلام. وُزّعت لأول مرة عام 1993، وأصبحت HTK سريعاً منصة مرجعية في مختبرات اللسانيات الحاسوبية حول العالم، وتبعها تنسيق الملفات الخاص بها. يخزّن كل ملف تسلسلاً من متجهات المعاملات أو العينات الخام مسبوقاً بترويسة من 12 بايت تحدد عدد الإطارات وفترة الإطار بوحدات 100 نانوثانية وعدد البايتات لكل إطار ورمز نوع يشير إلى طبيعة البيانات — تتراوح الخيارات من PCM للشكل الموجي إلى معاملات MFCC وطاقات مصفاة الترشيح. هذا التنوع يتيح لحاوية واحدة حمل كل من الصوت المصدر والميزات المستخلصة دون تغيير المحللات. تتجنب الترويسة المختصرة عمداً حشو المحاذاة أو الكتل الاختيارية، مما يجعل التنسيق سهل القراءة من C أو Python أو MATLAB ببضعة أسطر من الإدخال/الإخراج الثنائي. ثلاث مزايا تدعم أهمية HTK المستمرة: التكامل الوثيق مع خط أنابيب التدريب والتعرف في HTK، والتخطيط الحتمي للبايتات الذي يزيل غموض التحليل، والاعتماد الواسع في المدونات الأكاديمية.
الإصدار الأول: 1993

أسئلة مكررة

لماذا أحوّل VOB إلى HTK؟

HTK هي صيغة مجموعة أدوات نماذج ماركوف المخفية. ملفات DVD VOB التي تحتوي على حوار تصبح بيانات تدريب كلامية لأبحاث التعرف على الكلام.

ما هو صوت HTK؟

يخزّن HTK صوت PCM أحادي القناة 16 بت. مصمم خصيصاً لإطار عمل Cambridge HTK للتعرف على الكلام وتحليله.

هل يعمل صوت DVD المحيطي؟

HTK أحادي القناة. يتم مزج صوت DVD متعدد القنوات من VOB إلى قناة واحدة — إجراء قياسي لعمل معالجة الكلام.

هل تُحفظ جودة الحوار؟

يخزّن HTK صوت PCM غير مضغوط 16 بت. يحتفظ الحوار من ملفات DVD VOB بكامل وضوحه لتدريب وتحليل التعرف على الكلام.

هل يمكنني معالجة عدة فصول VOB؟

ارفع عدة ملفات VOB وحوّلها دفعة واحدة إلى HTK. ابنِ مجموعة بيانات كلامية من DVD بالكامل في عملية واحدة.