محوّل OGG إلى SPH

أنتج صوت SPHERE لأبحاث الكلام من OGG

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

معيار المجموعات الكلامية

SPH هو الصيغة وراء مجموعات بيانات الكلام الكبرى — حوّل تسجيلات OGG إلى صوت بحثي منسّق بشكل صحيح.

تحضير مجموعات البيانات

عالج مجموعات OGG الكلامية بالكامل إلى SPH في وقت واحد — جهّز مجموعات البحث في عملية واحدة.

تحويل أونلاين

لا حاجة لتثبيت أدوات كلام — أنتج ملفات SPH من OGG مباشرةً عبر متصفحك.

كيفية تحويل OGG إلى SPH

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة sph أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة sph فِيما بعد

عن الصيغ

OGG Vorbis هو مرمّز صوتي مفتوح وخالٍ من الرسوم ذو فقدان داخل تنسيق حاوية Ogg، وكلاهما طوّرتهما مؤسسة Xiph.Org. صُمّم Vorbis كبديل خالٍ من براءات الاختراع لـ MP3 وAAC، باستخدام ترميز تحويل جيب التمام المنفصل المعدّل (MDCT) مع ترميز بمعدل بت متغير يتكيف مع تعقيد الإشارة لكل إطار. أظهرت اختبارات الاستماع العمياء باستمرار أن Vorbis يقدم جودة إدراكية تضاهي أو تتفوق على MP3، خاصة في نطاق 96-192 كيلوبت/ثانية. يدعم التنسيق معدلات عينة من 8 كيلوهرتز إلى 192 كيلوهرتز ومن 1 إلى 255 قناة، مما يغطي كل شيء من الصوت الأحادي إلى المزيج المحيطي. من أبرز مزاياه الغياب الكامل لرسوم الترخيص — يمكن لمطوري الألعاب ومنصات البث ومصنّعي الأجهزة تنفيذ Vorbis دون مخاوف بشأن الرسوم. اعتمد Spotify على Vorbis لسنوات كمرمّز بث أساسي لهذا السبب بالذات. يتعامل التنسيق أيضاً مع تدهور الجودة عند معدلات البت المنخفضة بأناقة أكبر من كثير من المنافسين، ولهذا يظل رائجاً في ألعاب الفيديو حيث تكون المساحة محدودة وتتنافس آلاف المؤثرات الصوتية على الحجم. يوفر VLC وFirefox وChrome وAndroid جميعها فك ترميز Vorbis أصلياً.
المطوّر: Xiph.Org Foundation
الإصدار الأول: ١ مايو، ٢٠٠٠
SPH هو امتداد الملفات للصوت المخزّن بتنسيق NIST SPHERE (موارد ترويسة الكلام)، وهو معيار ابتكره المعهد الوطني الأمريكي للمعايير والتقنية نحو عام 1990. مصمم لأبحاث الكلام، تحمل ملفات SPH ترويسة ASCII من 1024 بايت مليئة بالبيانات الوصفية — معرّفات قواعد البيانات وعدد القنوات ومعدلات العينة وترتيب البايتات ونوع الضغط — مما يجعل كل تسجيل ذاتي الوصف. عادةً ما يكون الصوت الأساسي PCM خطي بدقة 16 بت بمعدل 16 كيلوهرتز، رغم أن تكوينات أخرى مسموح بها. يعتمد الباحثون في NIST وDARPA والجامعات حول العالم على SPH لتوزيع مدونات الكلام مثل TIMIT وSwitchboard ومجموعات LDC التي تدعم أنظمة التعرف التلقائي على الكلام الحديثة. من أبرز مزاياه أن الترويسة القابلة للقراءة البشرية تتيح للنصوص البرمجية تحليل بيانات التسجيل الوصفية دون فك ترميز ثنائي. كما يزيل التقييس الصارم للتنسيق الغموض عند مشاركة مجموعات البيانات عبر المؤسسات والمنصات. ولأن ملفات SPH تخزّن PCM غير مضغوط، فإنها تحافظ على دقة صوتية كاملة — وهو أمر حيوي عند تدريب النماذج الصوتية حيث يمكن حتى للتشوهات الصغيرة أن تحرف النتائج.
الإصدار الأول: 1990

أسئلة مكررة

لماذا أحوّل OGG إلى SPH؟

SPH (SPHERE) هو الصيغة التي حدّدها NIST لمجموعات بيانات أبحاث الكلام. سلاسل تدريب التعرّف على الكلام والأدوات اللغوية تتوقع مدخلات بصيغة SPHERE.

ما الذي يستخدم ملفات SPH؟

Kaldi وHTK وأدوات تقييم NIST ومجموعات الكلام الأكاديمية مثل TIMIT وSwitchboard تستخدم SPHERE صيغةً صوتية.

هل SPH هو نفسه NIST؟

SPH وNIST كلاهما يشير إلى صيغة SPHERE — موارد ترويسة الكلام التي حدّدها المعهد الوطني للمعايير والتقنية.

ما معدل العيّنة الذي يستخدمه SPH؟

مجموعات الكلام تستخدم عادةً 8 أو 16 كيلوهرتز. المحوّل يتعامل مع إعادة العيّنة من مصدر OGG تلقائيًا.

هل يمكنني تحويل مجموعة بيانات كاملة؟

ارفع مجموعة تسجيلات OGG الكلامية وأنتج مخرجات SPH لكل ملف دفعةً واحدة — جاهز لأبحاث التعرّف على الكلام.

OGG إلى SPH تصنيف الجودة

4.0 (1 الأصوات)
تحتاج إلى تحويل وتنزيل ملف واحد على الأقل لتقديم التغذية الراجعة!