تقرير BALSAM 2025: تقييم نضج نماذج الذكاء الاصطناعي بالعربية
أطلقت الأكاديمية العالمية الملك سلمان للغة العربية تقريرها عبر BALSAM حول أداء نماذج اللغة العربية في الذكاء الاصطناعي للنصف الأول من عام 2025.

تفاصيل التقرير
أصدر مؤشر بلسم (BALSAM) تقرير النصف الأول لعام 2025، حيث يُعد منصة موحدة وموثوقة لقياس أداء نماذج اللغة العربية الضخمة في مجموعة واسعة من المهام اللغوية.
- التقرير يشمل تقييم 78 مهمة تغطي 14 مجالًا لغويًا، مثل الترجمة، التلخيص، تصحيح القواعد، فهم النص، وتوليد المحتوى.
- بيانات التقييم تحتوي على أكثر من 52 ألف مثال، منها حوالي 37 ألف للاختبار و15 ألف للتطوير.
- المنصة تسمح للمطورين والباحثين بإجراء اختبارات مقارنة دقيقة لأداء نماذجهم ضمن بيئة تحافظ على عدالة التقييم وتمنع تسرب بيانات التدريب.
الأهداف المستقبلية لمؤشر BALSAM
يسعى التقرير إلى بناء بيئة تقييم متكاملة تساعد في تطوير تقنيات اللغة العربية بشكل مسؤول ومتقدم، وتشمل أهداف مؤشر BALSAM ما يلي:
- توحيد المعايير العالمية لتقييم نماذج اللغة العربية في الذكاء الاصطناعي عبر منصة موحدة.
- توفير مجموعات بيانات خاصة بكل مجال لغوي لضمان تغطية شاملة وتنوع لغوي.
- دعم الشفافية والمنافسة الصحية بين الباحثين والمطورين.
- تعزيز تطبيق الممارسات الأخلاقية في الذكاء الاصطناعي، كضمان العدالة والدقة والمساءلة في النتائج.
- تشجيع التعاون المجتمعي في مجال معالجة اللغة العربية، عبر مؤسسات أكاديمية وهيئات وطنية ودولية.
يمثّل هذا التقرير خطوة استراتيجية نحو تطوير بيئة ذكاء اصطناعي عربية أكثر نضجًا ودقة. ومن خلال مؤشرات قياس دقيقة وبيئة تقييم موحدة، يفتح BALSAM المجال أمام تحسين مستمر لنماذج اللغة العربية، بما يعكس طموحات التحول الرقمي في العالم العربي.
