إنفيديا

Nvidia Canary-Qwen-2.5B يتصدر لوائح تعرف على الكلام عالميًا

يواصل الذكاء الاصطناعي التطور سريعًا، حيث قدمت شركة إنفيديا نموذجًا جديدًا يحمل أسم “Canary-Qwen-2.5B” يحقق أداءً متفوقًا في التعرف على الكلام.

تفاصيل الخبر

قبل أيام أعلنت NVIDIA عن إطلاق نموذج Canary-Qwen-2.5B، وهو نموذج للتعرف التلقائي على الكلام باللغة الإنجليزية. يعمل النموذج في وضعين مختلفين، ASR وLLM، ويجمع بين قدرات التحويل النصي وخصائص النماذج اللغوية الكبيرة. ومن أبرز التفاصيل:

  • يحتوي على 2.5 مليار معلمة لتحقيق دقة عالية في النسخ.
  • يعمل بسرعة 418 RTFx لدعم عمليات النسخ الفوري.
  • يدعم الترقيم والحروف الكبيرة في النصوص الناتجة.
  • يوفر خيارين: وضع ASR للنسخ فقط ووضع LLM لمعالجة النصوص بعد نسخها.
  • تم تدريبه على أكثر من 234 ألف ساعة من البيانات الصوتية العامة.
  • متوافق مع بيئات Linux وWindows وأجهزة NVIDIA المختلفة.
  • مرخص وفق CC-BY-4.0 للاستخدام التجاري.

الأهداف المستقبلية

تسعى إنفيديا من خلال هذا النموذج إلى تحقيق أهداف مستقبلية واضحة:

  • تطوير دعم لغات إضافية بجانب الإنجليزية.
  • تحسين القدرة على التعامل مع ملفات صوتية أطول.
  • تعزيز إمكانيات التلخيص والإجابة عن الأسئلة في وضع LLM.
  • دعم تكامل أعمق مع أدوات NeMo لتحسين تجربة المطورين.

في الختام، يمثل Canary-Qwen-2.5B خطوة كبيرة للأمام في مجال التعرف على الكلام، ويفتح الباب أمام تطبيقات واسعة النطاق وابتكارات مستقبلية مثيرة.

مقالات مشابهة