محول HTK إلى SPX

يمكنك تحويل ملفات htk إلى spx على الإنترنت وبشكل مجاني

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى

الإعدادات

قم بتعيين معدّل البت الصوتي الكلي لإخراج الـ Speex. يبلغ Speex، المُصمَّم لتشفير الكلام البشري، مستوى الشفافية عند معدل بت منخفض للغاية مع 44 kbps كحد أقصى.
قم بتعيين عدد القنوات الصوتية. يكون هذا الإعداد أكثر فائدة عند اختزال القنوات (على سبيل المثال، من 5.1 إلى ستيريو).
قم بتعيين معدل عينة الصوت. تتطلّب الموسيقى ذات الطيف الكامل (20 Hz — 20 kHz) قيماً لا تقل عن 44.1 kHz لتحقيق الشفافية. يمكن العثور على مزيد من المعلومات على ويكي.

htk

HTK هو حاوية أشكال موجية أصلية لـ حزمة أدوات نموذج ماركوف المخفي، وهي مجموعة برمجيات طُوّرت في قسم الهندسة بجامعة كامبريدج لأبحاث التعرف على الكلام. وُزّعت لأول مرة عام 1993، وأصبحت HTK سريعاً منصة مرجعية في مختبرات اللسانيات الحاسوبية حول العالم، وتبعها تنسيق الملفات الخاص بها. يخزّن كل ملف تسلسلاً من متجهات المعاملات أو العينات الخام مسبوقاً بترويسة من 12 بايت تحدد عدد الإطارات وفترة الإطار بوحدات 100 نانوثانية وعدد البايتات لكل إطار ورمز نوع يشير إلى طبيعة البيانات — تتراوح الخيارات من PCM للشكل الموجي إلى معاملات MFCC وطاقات مصفاة الترشيح. هذا التنوع يتيح لحاوية واحدة حمل كل من الصوت المصدر والميزات المستخلصة دون تغيير المحللات. تتجنب الترويسة المختصرة عمداً حشو المحاذاة أو الكتل الاختيارية، مما يجعل التنسيق سهل القراءة من C أو Python أو MATLAB ببضعة أسطر من الإدخال/الإخراج الثنائي. ثلاث مزايا تدعم أهمية HTK المستمرة: التكامل الوثيق مع خط أنابيب التدريب والتعرف في HTK، والتخطيط الحتمي للبايتات الذي يزيل غموض التحليل، والاعتماد الواسع في المدونات الأكاديمية.
اقرأ المزيد

spx

Speex هو مرمّز صوتي مفتوح المصدر مصمم خصيصاً لضغط الكلام، طوّره جان مارك فالين تحت مظلة مؤسسة Xiph.Org. أُصدر لأول مرة في أكتوبر 2002، ويستهدف نقل الصوت عبر الإنترنت والمؤتمرات وأي سيناريو يحتاج فيه الكلام المنطوق للانتقال بكفاءة عبر الشبكة. تغلّف ملفات SPX صوتاً مرمّزاً بـ Speex داخل حاوية Ogg، مما يجمع بين تحسين المرمّز للكلام وقدرات Ogg في البث. يُدعم ثلاثة معدلات أخذ عينات — ضيق النطاق عند 8 كيلوهرتز، وواسع النطاق عند 16 كيلوهرتز، وفائق الاتساع عند 32 كيلوهرتز — مع ترميز بمعدل بت متغير يتكيف آنياً مع تعقيد الكلام. من أبرز مزاياه طبيعته الخالية من براءات الاختراع والمرخصة بترخيص BSD، مما أتاح للمطورين تضمينه بحرية في المنتجات التجارية والمفتوحة المصدر. يجمع Speex أيضاً إلغاء الصدى الصوتي وكبت الضوضاء والتحكم التلقائي في الكسب، وهي ميزات تفوّضها المرمّزات المنافسة عادةً لمكتبات خارجية. رغم أن مبتكريه يوصون رسمياً بـ Opus كخليفة منذ 2012، يظل Speex منتشراً في أنظمة VoIP القديمة والتسجيلات المؤرشفة والأجهزة المدمجة حيث لا تزال بصمة مفكّك الترميز الخفيفة ذات قيمة.
اقرأ المزيد
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

كيفية تحويل HTK إلى SPX

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة spx أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة spx فِيما بعد

عن الصيغ

HTK هو حاوية أشكال موجية أصلية لـ حزمة أدوات نموذج ماركوف المخفي، وهي مجموعة برمجيات طُوّرت في قسم الهندسة بجامعة كامبريدج لأبحاث التعرف على الكلام. وُزّعت لأول مرة عام 1993، وأصبحت HTK سريعاً منصة مرجعية في مختبرات اللسانيات الحاسوبية حول العالم، وتبعها تنسيق الملفات الخاص بها. يخزّن كل ملف تسلسلاً من متجهات المعاملات أو العينات الخام مسبوقاً بترويسة من 12 بايت تحدد عدد الإطارات وفترة الإطار بوحدات 100 نانوثانية وعدد البايتات لكل إطار ورمز نوع يشير إلى طبيعة البيانات — تتراوح الخيارات من PCM للشكل الموجي إلى معاملات MFCC وطاقات مصفاة الترشيح. هذا التنوع يتيح لحاوية واحدة حمل كل من الصوت المصدر والميزات المستخلصة دون تغيير المحللات. تتجنب الترويسة المختصرة عمداً حشو المحاذاة أو الكتل الاختيارية، مما يجعل التنسيق سهل القراءة من C أو Python أو MATLAB ببضعة أسطر من الإدخال/الإخراج الثنائي. ثلاث مزايا تدعم أهمية HTK المستمرة: التكامل الوثيق مع خط أنابيب التدريب والتعرف في HTK، والتخطيط الحتمي للبايتات الذي يزيل غموض التحليل، والاعتماد الواسع في المدونات الأكاديمية.
الإصدار الأول: 1993
Speex هو مرمّز صوتي مفتوح المصدر مصمم خصيصاً لضغط الكلام، طوّره جان مارك فالين تحت مظلة مؤسسة Xiph.Org. أُصدر لأول مرة في أكتوبر 2002، ويستهدف نقل الصوت عبر الإنترنت والمؤتمرات وأي سيناريو يحتاج فيه الكلام المنطوق للانتقال بكفاءة عبر الشبكة. تغلّف ملفات SPX صوتاً مرمّزاً بـ Speex داخل حاوية Ogg، مما يجمع بين تحسين المرمّز للكلام وقدرات Ogg في البث. يُدعم ثلاثة معدلات أخذ عينات — ضيق النطاق عند 8 كيلوهرتز، وواسع النطاق عند 16 كيلوهرتز، وفائق الاتساع عند 32 كيلوهرتز — مع ترميز بمعدل بت متغير يتكيف آنياً مع تعقيد الكلام. من أبرز مزاياه طبيعته الخالية من براءات الاختراع والمرخصة بترخيص BSD، مما أتاح للمطورين تضمينه بحرية في المنتجات التجارية والمفتوحة المصدر. يجمع Speex أيضاً إلغاء الصدى الصوتي وكبت الضوضاء والتحكم التلقائي في الكسب، وهي ميزات تفوّضها المرمّزات المنافسة عادةً لمكتبات خارجية. رغم أن مبتكريه يوصون رسمياً بـ Opus كخليفة منذ 2012، يظل Speex منتشراً في أنظمة VoIP القديمة والتسجيلات المؤرشفة والأجهزة المدمجة حيث لا تزال بصمة مفكّك الترميز الخفيفة ذات قيمة.
المطوّر: Xiph.Org Foundation
الإصدار الأول: ١٥ أكتوبر، ٢٠٠٢