محوّل OGG إلى NIST

أنتج ملفات NIST SPHERE للأبحاث الصوتية من OGG

أسقِط الملفات هنا. 1 GB الحد الأقصى لحجم الملف أو تسجيل
إلى
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

معيار أبحاث الكلام

NIST SPHERE مطلوب من أدوات معالجة الكلام الرئيسية — أنتج ملفات منسّقة بشكل صحيح من تسجيلات OGG.

مخرجات جاهزة للمجموعات البحثية

أنشئ ملفات SPHERE بترويسات صحيحة، جاهزة لتدريب التعرّف على الكلام والتحليل اللغوي.

معالجة أونلاين

لا حاجة لتثبيت أدوات كلام — حوّل OGG إلى NIST SPHERE مباشرةً عبر متصفحك.

كيفية تحويل OGG إلى NIST

1

قُم بتحديد الملفات من جهاز الحاسوب وGoogle Drive وDropbox، ورابط URL أو من خلال سحبها إلى الصفحة.

2

اختر صيغة nist أو أية صيغة أخرى أنت بحاجةٍ إليها كنتيجة (أكثر من 200 صيغة مدعومة)

3

هيا قُم بتحويل الملف وسوف يمكنك تنزيل ملفك بصيغة nist فِيما بعد

عن الصيغ

OGG Vorbis هو مرمّز صوتي مفتوح وخالٍ من الرسوم ذو فقدان داخل تنسيق حاوية Ogg، وكلاهما طوّرتهما مؤسسة Xiph.Org. صُمّم Vorbis كبديل خالٍ من براءات الاختراع لـ MP3 وAAC، باستخدام ترميز تحويل جيب التمام المنفصل المعدّل (MDCT) مع ترميز بمعدل بت متغير يتكيف مع تعقيد الإشارة لكل إطار. أظهرت اختبارات الاستماع العمياء باستمرار أن Vorbis يقدم جودة إدراكية تضاهي أو تتفوق على MP3، خاصة في نطاق 96-192 كيلوبت/ثانية. يدعم التنسيق معدلات عينة من 8 كيلوهرتز إلى 192 كيلوهرتز ومن 1 إلى 255 قناة، مما يغطي كل شيء من الصوت الأحادي إلى المزيج المحيطي. من أبرز مزاياه الغياب الكامل لرسوم الترخيص — يمكن لمطوري الألعاب ومنصات البث ومصنّعي الأجهزة تنفيذ Vorbis دون مخاوف بشأن الرسوم. اعتمد Spotify على Vorbis لسنوات كمرمّز بث أساسي لهذا السبب بالذات. يتعامل التنسيق أيضاً مع تدهور الجودة عند معدلات البت المنخفضة بأناقة أكبر من كثير من المنافسين، ولهذا يظل رائجاً في ألعاب الفيديو حيث تكون المساحة محدودة وتتنافس آلاف المؤثرات الصوتية على الحجم. يوفر VLC وFirefox وChrome وAndroid جميعها فك ترميز Vorbis أصلياً.
المطوّر: Xiph.Org Foundation
الإصدار الأول: ١ مايو، ٢٠٠٠
NIST SPHERE (موارد ترويسة الكلام) هو تنسيق ملفات صوتية متخصص ابتكره المعهد الوطني للمعايير والتقنية لأبحاث الكلام، وخاصة المشاريع الممولة من DARPA. يغلّف التنسيق العينات الصوتية الخام بترويسة ASCII منظمة تشفّر بيانات وصفية مثل معدل العينة وعدد القنوات ونوع الترميز والخصائص الديموغرافية للمتحدث والتعليقات التوضيحية للنسخ — مما يجعله مثالياً لتوزيع مدونات الكلام. تخزّن ملفات NIST عادةً صوت PCM غير مضغوط أو mu-law بمعدلات عينة بجودة هاتفية (8 كيلوهرتز أو 16 كيلوهرتز)، رغم أن الحاوية مرنة بما يكفي لاستيعاب ترميزات متنوعة. من أبرز مزاياه الترويسة الغنية ذاتية التوثيق التي تتيح للباحثين تضمين بيانات المدونة الوصفية مباشرة في الملف، مما يلغي الحاجة لملفات مرافقة. أصبح SPHERE أيضاً المعيار الفعلي لـ قواعد بيانات الكلام الرئيسية مثل TIMIT وSwitchboard ومدونة Fisher، مما يضمن اعترافاً واسعاً عبر المختبرات الأكاديمية والحكومية. تسهّل المواصفات المفتوحة وتوفر أدوات سطر الأوامر (sphere وh_strip وw_decode) عمليات التحويل والفحص والمعالجة برمجياً ضمن خطوط أنابيب معالجة الكلام.
الإصدار الأول: 1990

أسئلة مكررة

لماذا أحوّل OGG إلى NIST؟

NIST SPHERE هو التنسيق المعياري لمجموعات بيانات أبحاث الكلام. أدوات البحث اللغوي وسلاسل تدريب التعرّف على الكلام تتوقع صوتًا بصيغة SPHERE.

ما الذي يستخدم ملفات NIST؟

HTK وKaldi وأدوات تقييم NIST ومجموعات أبحاث الكلام الأكاديمية تستخدم SPHERE صيغةً صوتية أساسية.

هل NIST هو نفسه SPHERE؟

نعم — NIST SPHERE (موارد ترويسة الكلام) حدّده المعهد الوطني للمعايير والتقنية لاستخدامات أبحاث الكلام.

ما معدلات العيّنة التي يدعمها NIST؟

ملفات SPHERE تستخدم عادةً 8 أو 16 كيلوهرتز — معدلات قياسية لأبحاث الكلام الهاتفي والنطاق العريض.

هل يمكنني تحويل دفعة من OGG إلى NIST؟

ارفع مجموعة بيانات OGG الصوتية بالكامل وحوّلها إلى NIST SPHERE دفعةً واحدة — جاهزة لسلاسل معالجة البحث.