محوّل OPUS إلى SPH

أنتج صوت SPHERE لأبحاث الكلام من OPUS

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

تنسيق المجموعات الكلامية

SPH هو المعيار وراء مجموعات بيانات الكلام الرئيسية — حوّل تسجيلات OPUS إلى صوت جاهز للبحث.

تحضير مجموعات البيانات

عالج مجموعات OPUS كاملة إلى SPH دفعة واحدة — جهّز المجموعات في عملية واحدة.

تحويل عبر الإنترنت

لا حاجة لأدوات كلام — أنتج SPH من OPUS مباشرة في متصفحك.

كيفية تحويل OPUS إلى SPH

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة sph أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة sph فِيما بعد

عن الصيغ

Opus هو مرمّز صوتي متعدد الاستخدامات ومفتوح، معتمد من IETF كمعيار RFC 6716 عام 2012. يدمج نهجين في الترميز — SILK للكلام وCELT للموسيقى — في خوارزمية واحدة تمزج بينهما بناءً على نوع المحتوى ومعدل البت. هذا التصميم الهجين يتيح لـ Opus التفوق على أي مرمّز آخر تقريباً عبر نطاق واسع من الاستخدامات: صوت منخفض زمن الاستجابة بسرعة 6 كيلوبت/ثانية، وموسيقى عالية الدقة بسرعة 128 كيلوبت/ثانية، وكل ما بينهما. يدعم معدلات بت من 6 إلى 510 كيلوبت/ثانية، ومعدلات عينة تصل إلى 48 كيلوهرتز، وأحجام إطارات صغيرة تصل إلى 2.5 مللي ثانية، مما يمنحه أقل زمن انتقال خوارزمي بين مرمّزات الصوت السائدة. ثلاث مزايا تجعل Opus مقنعاً بشكل خاص. فهو خالٍ من الرسوم ومفتوح المصدر بالكامل، مما يزيل حواجز الترخيص التي تعيق المرمّزات الخاصة. ويحقق جودة شفافة بنحو نصف معدل بت MP3 ويتفوق على AAC بمعدلات مكافئة. وزمن الاستجابة المنخفض يجعله المرمّز الإلزامي لـ WebRTC، فكل متصفح حديث يأتي مع فك ترميز Opus مدمج. يعتمد عليه WhatsApp وDiscord وZoom وYouTube للصوت في الوقت الفعلي.
الإصدار الأول: ١١ سبتمبر، ٢٠١٢
SPH هو امتداد الملفات للصوت المخزّن بتنسيق NIST SPHERE (موارد ترويسة الكلام)، وهو معيار ابتكره المعهد الوطني الأمريكي للمعايير والتقنية نحو عام 1990. مصمم لأبحاث الكلام، تحمل ملفات SPH ترويسة ASCII من 1024 بايت مليئة بالبيانات الوصفية — معرّفات قواعد البيانات وعدد القنوات ومعدلات العينة وترتيب البايتات ونوع الضغط — مما يجعل كل تسجيل ذاتي الوصف. عادةً ما يكون الصوت الأساسي PCM خطي بدقة 16 بت بمعدل 16 كيلوهرتز، رغم أن تكوينات أخرى مسموح بها. يعتمد الباحثون في NIST وDARPA والجامعات حول العالم على SPH لتوزيع مدونات الكلام مثل TIMIT وSwitchboard ومجموعات LDC التي تدعم أنظمة التعرف التلقائي على الكلام الحديثة. من أبرز مزاياه أن الترويسة القابلة للقراءة البشرية تتيح للنصوص البرمجية تحليل بيانات التسجيل الوصفية دون فك ترميز ثنائي. كما يزيل التقييس الصارم للتنسيق الغموض عند مشاركة مجموعات البيانات عبر المؤسسات والمنصات. ولأن ملفات SPH تخزّن PCM غير مضغوط، فإنها تحافظ على دقة صوتية كاملة — وهو أمر حيوي عند تدريب النماذج الصوتية حيث يمكن حتى للتشوهات الصغيرة أن تحرف النتائج.
الإصدار الأول: 1990

أسئلة مكررة

لماذا تحويل OPUS إلى SPH؟

SPH (SPHERE) هو المعيار المحدد من NIST لمجموعات أبحاث الكلام. أنظمة ASR والأدوات اللغوية تتوقع إدخالات بتنسيق SPHERE.

ما الذي يستخدم SPH؟

Kaldi وHTK وأدوات تقييم NIST ومجموعات بيانات الكلام الأكاديمية مثل TIMIT تستخدم SPHERE كتنسيق صوتي.

هل SPH هو نفسه NIST؟

نعم — SPH وNIST كلاهما يشير إلى SPHERE المعرّف من المعهد الوطني للمعايير والتكنولوجيا.

ما ترددات العينة المعتادة؟

مجموعات الكلام البحثية تستخدم عادة 8 أو 16 كيلوهرتز — المحوّل يعيد تردد العينة من OPUS تلقائياً.

هل يمكنني تحويل مجموعة بيانات؟

ارفع مجموعة تسجيلات OPUS الكلامية كاملة وأنتج SPH لكل ملف — جاهز للبحث.