Nvidia Canary-Qwen-2.5B يتصدر لوائح تعرف على الكلام عالميًا
يواصل الذكاء الاصطناعي التطور سريعًا، حيث قدمت شركة إنفيديا نموذجًا جديدًا يحمل أسم “Canary-Qwen-2.5B” يحقق أداءً متفوقًا في التعرف على الكلام.

تفاصيل الخبر
قبل أيام أعلنت NVIDIA عن إطلاق نموذج Canary-Qwen-2.5B، وهو نموذج للتعرف التلقائي على الكلام باللغة الإنجليزية. يعمل النموذج في وضعين مختلفين، ASR وLLM، ويجمع بين قدرات التحويل النصي وخصائص النماذج اللغوية الكبيرة. ومن أبرز التفاصيل:
- يحتوي على 2.5 مليار معلمة لتحقيق دقة عالية في النسخ.
- يعمل بسرعة 418 RTFx لدعم عمليات النسخ الفوري.
- يدعم الترقيم والحروف الكبيرة في النصوص الناتجة.
- يوفر خيارين: وضع ASR للنسخ فقط ووضع LLM لمعالجة النصوص بعد نسخها.
- تم تدريبه على أكثر من 234 ألف ساعة من البيانات الصوتية العامة.
- متوافق مع بيئات Linux وWindows وأجهزة NVIDIA المختلفة.
- مرخص وفق CC-BY-4.0 للاستخدام التجاري.
الأهداف المستقبلية
تسعى إنفيديا من خلال هذا النموذج إلى تحقيق أهداف مستقبلية واضحة:
- تطوير دعم لغات إضافية بجانب الإنجليزية.
- تحسين القدرة على التعامل مع ملفات صوتية أطول.
- تعزيز إمكانيات التلخيص والإجابة عن الأسئلة في وضع LLM.
- دعم تكامل أعمق مع أدوات NeMo لتحسين تجربة المطورين.
في الختام، يمثل Canary-Qwen-2.5B خطوة كبيرة للأمام في مجال التعرف على الكلام، ويفتح الباب أمام تطبيقات واسعة النطاق وابتكارات مستقبلية مثيرة.
