محول AVI إلى SPH

استخرج صوت AVI بصيغة NIST SPHERE للكلام عبر الإنترنت

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

من AVI إلى بيانات كلام

حوّل صوت الفيديو من AVI إلى بيانات كلام بصيغة SPHERE، جاهزة للمجموعات اللغوية وتدريب التعرف والتحليل الصوتي.

معالجة على الخوادم

يتم استخراج الصوت وترميز SPH على خوادمنا. جهازك يبقى حراً — لا حاجة لتثبيت برامج محلية.

إخراج جاهز للبحث

إخراج SPH من ملفات AVI يتوافق مع مواصفات NIST SPHERE. استورده مباشرة في Kaldi أو HTK أو أطر معالجة الكلام الأخرى.

كيفية تحويل AVI إلى SPH

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة sph أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة sph فِيما بعد

عن الصيغ

AVI (تداخل الصوت والفيديو) هي واحدة من أقدم صيغ حاويات الوسائط المتعددة وأكثرها شهرة، قدمتها Microsoft في نوفمبر 1992 كجزء من تقنية Video for Windows. مبنية على هيكل صيغة تبادل الموارد (RIFF)، تتداخل AVI بيانات الصوت والفيديو في أجزاء متناوبة، مما يسمح بتشغيل متزامن دون الحاجة إلى إدارة تدفقات معقدة. الصيغة مستقلة عن الترميز، مما يعني أنها يمكن أن تحتوي على فيديو مضغوط بأي ترميز تقريباً، من Cinepak وIndeo المبكرة إلى DivX وXvid وH.264 الحديثة. ساهمت هذه المرونة في الاعتماد الواسع عبر الحواسيب الشخصية طوال التسعينيات والعقد الأول من الألفية الثالثة. من الخصائص الملحوظة البنية الداخلية المباشرة التي تجعل ملفات AVI سهلة التحرير والمعالجة نسبياً على مستوى البيانات الثنائية مقارنة بالحاويات الحديثة الأكثر تعقيداً. تدعم AVI أيضاً مسارات صوت متعددة، مما يتيح المحتوى متعدد اللغات داخل ملف واحد. ومع ذلك، تحتوي المواصفات الأصلية على قيود، بما في ذلك سقف حجم ملف يبلغ 2 جيجابايت في التطبيقات القديمة وعدم وجود دعم أصلي لمعدلات الإطارات المتغيرة أو صيغ الترجمة المتقدمة. عالجت امتدادات OpenDML (AVI 2.0) قيد الحجم بالسماح للملفات بتجاوز الحد الأصلي. رغم مرور عقود على إنشائها، تظل AVI واحدة من أكثر صيغ الوسائط المتعددة المعترف بها عالمياً ولا تزال مدعومة على نطاق واسع من قبل مشغلات الوسائط وأدوات التحرير عبر جميع أنظمة التشغيل الرئيسية.
المطوّر: Microsoft
الإصدار الأول: ١٠ نوفمبر، ١٩٩٢
SPH هو امتداد الملفات للصوت المخزّن بتنسيق NIST SPHERE (موارد ترويسة الكلام)، وهو معيار ابتكره المعهد الوطني الأمريكي للمعايير والتقنية نحو عام 1990. مصمم لأبحاث الكلام، تحمل ملفات SPH ترويسة ASCII من 1024 بايت مليئة بالبيانات الوصفية — معرّفات قواعد البيانات وعدد القنوات ومعدلات العينة وترتيب البايتات ونوع الضغط — مما يجعل كل تسجيل ذاتي الوصف. عادةً ما يكون الصوت الأساسي PCM خطي بدقة 16 بت بمعدل 16 كيلوهرتز، رغم أن تكوينات أخرى مسموح بها. يعتمد الباحثون في NIST وDARPA والجامعات حول العالم على SPH لتوزيع مدونات الكلام مثل TIMIT وSwitchboard ومجموعات LDC التي تدعم أنظمة التعرف التلقائي على الكلام الحديثة. من أبرز مزاياه أن الترويسة القابلة للقراءة البشرية تتيح للنصوص البرمجية تحليل بيانات التسجيل الوصفية دون فك ترميز ثنائي. كما يزيل التقييس الصارم للتنسيق الغموض عند مشاركة مجموعات البيانات عبر المؤسسات والمنصات. ولأن ملفات SPH تخزّن PCM غير مضغوط، فإنها تحافظ على دقة صوتية كاملة — وهو أمر حيوي عند تدريب النماذج الصوتية حيث يمكن حتى للتشوهات الصغيرة أن تحرف النتائج.
الإصدار الأول: 1990

أسئلة مكررة

لماذا تحويل AVI إلى SPH؟

SPH (SPHERE) هو معيار صوتي للكلام من NIST يُستخدم في اللغويات والتعرف على الكلام. تحويل AVI يستخرج الحوار لمجموعات البيانات البحثية.

ما الأدوات التي تعمل مع ملفات SPH؟

HTK وKaldi وPraat وأطر تحليل الكلام الأخرى تقرأ SPH. توفر مجموعة أدوات NIST SPHERE أدوات أصلية لهذه الصيغة أيضاً.

هل SPH هو نفسه NIST؟

SPH وNIST كلاهما يشيران إلى صيغة SPHERE المحددة من المعهد الوطني للمعايير والتكنولوجيا. هما متطابقان وظيفياً.

هل يدعم SPH الصوت الاستريو؟

يمكن لملفات SPHERE تخزين بيانات متعددة القنوات، رغم أن مجموعات الكلام تستخدم عادة الأحادي. تُحفظ قنوات الصوت من AVI كما هي مُعدَّة.

هل يمكنني معالجة ملفات AVI كبيرة؟

تتعامل خوادمنا مع ملفات AVI بأحجام مختلفة. الفيديوهات الأكبر قد تستغرق وقتاً أطول قليلاً، لكن استخراج الصوت وترميز SPH يبقيان موثوقين.