محوّل OPUS إلى NIST

أنشئ ملفات NIST SPHERE للأبحاث الصوتية من OPUS

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

معيار الأبحاث الصوتية

NIST SPHERE مطلوب من أدوات ASR — أنتج ملفات منسّقة بشكل صحيح من تسجيلات OPUS.

إخراج جاهز للمجموعات

أنشئ ملفات SPHERE برؤوس صحيحة لتدريب التعرف على الكلام وتحليله.

معالجة عبر الإنترنت

لا حاجة لتثبيت أدوات — حوّل OPUS إلى NIST SPHERE في متصفحك.

كيفية تحويل OPUS إلى NIST

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة nist أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة nist فِيما بعد

عن الصيغ

Opus هو مرمّز صوتي متعدد الاستخدامات ومفتوح، معتمد من IETF كمعيار RFC 6716 عام 2012. يدمج نهجين في الترميز — SILK للكلام وCELT للموسيقى — في خوارزمية واحدة تمزج بينهما بناءً على نوع المحتوى ومعدل البت. هذا التصميم الهجين يتيح لـ Opus التفوق على أي مرمّز آخر تقريباً عبر نطاق واسع من الاستخدامات: صوت منخفض زمن الاستجابة بسرعة 6 كيلوبت/ثانية، وموسيقى عالية الدقة بسرعة 128 كيلوبت/ثانية، وكل ما بينهما. يدعم معدلات بت من 6 إلى 510 كيلوبت/ثانية، ومعدلات عينة تصل إلى 48 كيلوهرتز، وأحجام إطارات صغيرة تصل إلى 2.5 مللي ثانية، مما يمنحه أقل زمن انتقال خوارزمي بين مرمّزات الصوت السائدة. ثلاث مزايا تجعل Opus مقنعاً بشكل خاص. فهو خالٍ من الرسوم ومفتوح المصدر بالكامل، مما يزيل حواجز الترخيص التي تعيق المرمّزات الخاصة. ويحقق جودة شفافة بنحو نصف معدل بت MP3 ويتفوق على AAC بمعدلات مكافئة. وزمن الاستجابة المنخفض يجعله المرمّز الإلزامي لـ WebRTC، فكل متصفح حديث يأتي مع فك ترميز Opus مدمج. يعتمد عليه WhatsApp وDiscord وZoom وYouTube للصوت في الوقت الفعلي.
الإصدار الأول: ١١ سبتمبر، ٢٠١٢
NIST SPHERE (موارد ترويسة الكلام) هو تنسيق ملفات صوتية متخصص ابتكره المعهد الوطني للمعايير والتقنية لأبحاث الكلام، وخاصة المشاريع الممولة من DARPA. يغلّف التنسيق العينات الصوتية الخام بترويسة ASCII منظمة تشفّر بيانات وصفية مثل معدل العينة وعدد القنوات ونوع الترميز والخصائص الديموغرافية للمتحدث والتعليقات التوضيحية للنسخ — مما يجعله مثالياً لتوزيع مدونات الكلام. تخزّن ملفات NIST عادةً صوت PCM غير مضغوط أو mu-law بمعدلات عينة بجودة هاتفية (8 كيلوهرتز أو 16 كيلوهرتز)، رغم أن الحاوية مرنة بما يكفي لاستيعاب ترميزات متنوعة. من أبرز مزاياه الترويسة الغنية ذاتية التوثيق التي تتيح للباحثين تضمين بيانات المدونة الوصفية مباشرة في الملف، مما يلغي الحاجة لملفات مرافقة. أصبح SPHERE أيضاً المعيار الفعلي لـ قواعد بيانات الكلام الرئيسية مثل TIMIT وSwitchboard ومدونة Fisher، مما يضمن اعترافاً واسعاً عبر المختبرات الأكاديمية والحكومية. تسهّل المواصفات المفتوحة وتوفر أدوات سطر الأوامر (sphere وh_strip وw_decode) عمليات التحويل والفحص والمعالجة برمجياً ضمن خطوط أنابيب معالجة الكلام.
الإصدار الأول: 1990

أسئلة مكررة

لماذا تحويل OPUS إلى NIST؟

NIST SPHERE مطلوب من أدوات معالجة الكلام الرئيسية. الأبحاث اللغوية وتدريب ASR تحتاج إدخالات بتنسيق SPHERE.

ما الذي يستخدم NIST؟

HTK وKaldi وأدوات تقييم NIST والمجموعات الأكاديمية تعتمد SPHERE كتنسيق صوتي أساسي.

هل NIST هو نفسه SPH؟

نعم — كلاهما يشير إلى SPHERE (SPeech HEader Resources) المعرّف من المعهد الوطني للمعايير والتكنولوجيا.

ما ترددات العينة المستخدمة؟

SPHERE يستخدم عادة 8 أو 16 كيلوهرتز — المعدلات القياسية لأبحاث الكلام الهاتفي وعريض النطاق.

هل يمكنني تحويل دفعة؟

ارفع مجموعة بيانات OPUS الكاملة وحوّلها إلى NIST SPHERE في دفعة واحدة.