MKV to SPH Converter

Extract SPHERE audio from MKV for speech datasets

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Research Standard

SPH هو المعيار الذهبي لمجموعات أبحاث الكلام. استخرج صوت MKV بالتنسيق الذي تتوقعه أطر التعرف على الكلام.

Corpus Building

حوّل عدة ملفات MKV إلى SPH دفعة واحدة. فعال لتجميع مجموعات بيانات كلام كبيرة من تسجيلات الفيديو.

Confidential Data

تُحذف جميع ملفات MKV المرفوعة بعد المعالجة. تُمسح نتائج SPH خلال 24 ساعة — تبقى بيانات الكلام الحساسة خاصة.

كيفية تحويل MKV إلى SPH

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة sph أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة sph فِيما بعد

عن الصيغ

MKV (فيديو Matroska) هي صيغة حاوية وسائط متعددة مفتوحة المعيار طورها مشروع Matroska، الذي أعلن عن الصيغة في ديسمبر 2002. سُميت على اسم دمى الماتريوشكا الروسية المتداخلة، وبُنيت الصيغة على لغة EBML (لغة الوسم الثنائية القابلة للتوسيع)، وهي متغير ثنائي مبسط من XML يوفر بنية مرنة ومتوافقة مع المستقبل. يمكن لـ MKV استيعاب عدد غير محدود تقريباً من مسارات الفيديو والصوت والترجمة داخل ملف واحد، مع دعم ترميزات من H.264 وHEVC إلى VP9 وAV1 للفيديو، وAAC وFLAC وOpus وDTS للصوت. من الميزات البارزة الدعم الشامل للترجمات، حيث تتعامل مع صيغ من نص SRT البسيط إلى ترجمات ASS المنسقة المعقدة ومسارات PGS النقطية من أقراص Blu-ray. تدعم MKV أيضاً علامات الفصول والمرفقات (مثل الخطوط اللازمة للترجمات المنسقة) ووسوم البيانات الوصفية، مما يجعلها واحدة من أغنى الحاويات المتاحة بالميزات. تضمن المواصفات المفتوحة أن أي مطور يمكنه تنفيذ قراءة وكتابة MKV بدون رسوم ترخيص، مما دفع الاعتماد الواسع عبر مشغلات الوسائط وأدوات البث وبرامج الترميز. جعلت القدرة على تغليف أي مجموعة ترميزات تقريباً في ملف واحد منظم جيداً MKV الحاوية المفضلة لتوزيع الفيديو عالي الجودة والأرشفة ومكتبات الوسائط الشخصية.
المطوّر: Matroska
الإصدار الأول: ٦ ديسمبر، ٢٠٠٢
SPH هو امتداد الملفات للصوت المخزّن بتنسيق NIST SPHERE (موارد ترويسة الكلام)، وهو معيار ابتكره المعهد الوطني الأمريكي للمعايير والتقنية نحو عام 1990. مصمم لأبحاث الكلام، تحمل ملفات SPH ترويسة ASCII من 1024 بايت مليئة بالبيانات الوصفية — معرّفات قواعد البيانات وعدد القنوات ومعدلات العينة وترتيب البايتات ونوع الضغط — مما يجعل كل تسجيل ذاتي الوصف. عادةً ما يكون الصوت الأساسي PCM خطي بدقة 16 بت بمعدل 16 كيلوهرتز، رغم أن تكوينات أخرى مسموح بها. يعتمد الباحثون في NIST وDARPA والجامعات حول العالم على SPH لتوزيع مدونات الكلام مثل TIMIT وSwitchboard ومجموعات LDC التي تدعم أنظمة التعرف التلقائي على الكلام الحديثة. من أبرز مزاياه أن الترويسة القابلة للقراءة البشرية تتيح للنصوص البرمجية تحليل بيانات التسجيل الوصفية دون فك ترميز ثنائي. كما يزيل التقييس الصارم للتنسيق الغموض عند مشاركة مجموعات البيانات عبر المؤسسات والمنصات. ولأن ملفات SPH تخزّن PCM غير مضغوط، فإنها تحافظ على دقة صوتية كاملة — وهو أمر حيوي عند تدريب النماذج الصوتية حيث يمكن حتى للتشوهات الصغيرة أن تحرف النتائج.
الإصدار الأول: 1990

أسئلة مكررة

لماذا يجب تحويل MKV إلى SPH?

SPH (SPHERE) هو معيار NIST لمجموعات أبحاث الكلام. مطلوب من Linguistic Data Consortium وقواعد بيانات الكلام الرئيسية.

What reads SPH files?

أدوات NIST SPeech HEader Resources وHTK وKaldi وSoX وأطر معالجة الكلام الأكاديمية تتعامل مع ملفات SPH كمدخلات قياسية.

Is SPH used in AI training?

نعم — يُستخدم SPHERE على نطاق واسع لبيانات تدريب التعرف على الكلام. العديد من مجموعات بيانات ASR الأساسية توزع بتنسيق SPH.

هل يحتوي SPH على metadata؟

نعم — تتضمن ملفات SPH رأس نصي بمعدل العينة وعدد القنوات ونوع الترميز وبيانات وصفية أخرى مفيدة للمعالجة الآلية.

هل يمكنني batch-process MKV files؟

نعم — ارفع عدة تسجيلات MKV واستخرج صوت SPH منها جميعاً. مثالي لبناء مجموعات بيانات كلام من مصادر الفيديو.