محوّل OGG إلى HTK

أنشئ صوت معالجة الكلام HTK من ملفات OGG

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

صيغة التعرّف على الكلام

HTK هي معيار المدخلات لتدريب التعرّف على الكلام المعتمد على HMM — حوّل بيانات كلام OGG للاستخدام البحثي.

معالجة مجموعات البيانات

ارفع مجموعات كلام OGG كاملة وأنتج صوتًا بصيغة HTK لكل ملف في وقت واحد.

تحويل على الخادم

لا حاجة لتثبيت مجموعة أدوات HTK — يعمل تحويل OGG إلى HTK بالكامل أونلاين.

كيفية تحويل OGG إلى HTK

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة htk أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة htk فِيما بعد

عن الصيغ

OGG Vorbis هو مرمّز صوتي مفتوح وخالٍ من الرسوم ذو فقدان داخل تنسيق حاوية Ogg، وكلاهما طوّرتهما مؤسسة Xiph.Org. صُمّم Vorbis كبديل خالٍ من براءات الاختراع لـ MP3 وAAC، باستخدام ترميز تحويل جيب التمام المنفصل المعدّل (MDCT) مع ترميز بمعدل بت متغير يتكيف مع تعقيد الإشارة لكل إطار. أظهرت اختبارات الاستماع العمياء باستمرار أن Vorbis يقدم جودة إدراكية تضاهي أو تتفوق على MP3، خاصة في نطاق 96-192 كيلوبت/ثانية. يدعم التنسيق معدلات عينة من 8 كيلوهرتز إلى 192 كيلوهرتز ومن 1 إلى 255 قناة، مما يغطي كل شيء من الصوت الأحادي إلى المزيج المحيطي. من أبرز مزاياه الغياب الكامل لرسوم الترخيص — يمكن لمطوري الألعاب ومنصات البث ومصنّعي الأجهزة تنفيذ Vorbis دون مخاوف بشأن الرسوم. اعتمد Spotify على Vorbis لسنوات كمرمّز بث أساسي لهذا السبب بالذات. يتعامل التنسيق أيضاً مع تدهور الجودة عند معدلات البت المنخفضة بأناقة أكبر من كثير من المنافسين، ولهذا يظل رائجاً في ألعاب الفيديو حيث تكون المساحة محدودة وتتنافس آلاف المؤثرات الصوتية على الحجم. يوفر VLC وFirefox وChrome وAndroid جميعها فك ترميز Vorbis أصلياً.
المطوّر: Xiph.Org Foundation
الإصدار الأول: ١ مايو، ٢٠٠٠
HTK هو حاوية أشكال موجية أصلية لـ حزمة أدوات نموذج ماركوف المخفي، وهي مجموعة برمجيات طُوّرت في قسم الهندسة بجامعة كامبريدج لأبحاث التعرف على الكلام. وُزّعت لأول مرة عام 1993، وأصبحت HTK سريعاً منصة مرجعية في مختبرات اللسانيات الحاسوبية حول العالم، وتبعها تنسيق الملفات الخاص بها. يخزّن كل ملف تسلسلاً من متجهات المعاملات أو العينات الخام مسبوقاً بترويسة من 12 بايت تحدد عدد الإطارات وفترة الإطار بوحدات 100 نانوثانية وعدد البايتات لكل إطار ورمز نوع يشير إلى طبيعة البيانات — تتراوح الخيارات من PCM للشكل الموجي إلى معاملات MFCC وطاقات مصفاة الترشيح. هذا التنوع يتيح لحاوية واحدة حمل كل من الصوت المصدر والميزات المستخلصة دون تغيير المحللات. تتجنب الترويسة المختصرة عمداً حشو المحاذاة أو الكتل الاختيارية، مما يجعل التنسيق سهل القراءة من C أو Python أو MATLAB ببضعة أسطر من الإدخال/الإخراج الثنائي. ثلاث مزايا تدعم أهمية HTK المستمرة: التكامل الوثيق مع خط أنابيب التدريب والتعرف في HTK، والتخطيط الحتمي للبايتات الذي يزيل غموض التحليل، والاعتماد الواسع في المدونات الأكاديمية.
الإصدار الأول: 1993

أسئلة مكررة

لماذا أحوّل OGG إلى HTK؟

صيغة HTK مطلوبة من مجموعة أدوات Hidden Markov Model لتدريب نماذج التعرّف على الكلام. يحتاج الباحثون إلى بيانات مدخلات بصيغة HTK.

ما الذي يستخدم ملفات HTK؟

مجموعة أدوات HTK من جامعة كامبريدج وKaldi وخطوط أبحاث التعرّف على الكلام المختلفة تستهلك صوتًا بصيغة HTK.

هل HTK صيغة صوت شائعة؟

HTK متخصصة لأبحاث معالجة الكلام — ليست صيغة صوت عامة. تخزّن PCM 16 بت مع ترويسات مخصصة.

ما تردد العيّنة المطلوب لـ HTK؟

معظم مهام التعرّف على الكلام تستخدم 8 أو 16 كيلوهرتز مونو. يتعامل المحوّل مع إعادة تردد العيّنة من مصدر OGG تلقائيًا.

هل يمكنني تحويل مجموعة بيانات من ملفات OGG؟

ارفع مجموعة بيانات كلام كاملة بصيغة OGG وحوّلها إلى HTK دفعة واحدة — جاهزة لتدريب نماذج ASR.

OGG إلى HTK تصنيف الجودة

5.0 (1 الأصوات)
تحتاج إلى تحويل وتنزيل ملف واحد على الأقل لتقديم التغذية الراجعة!