DeepMind توسّع Game Arena لاختبار مهارات AI الاجتماعية

أعلنت Google DeepMind عن توسعة منصة Kaggle Game Arena لتشمل ألعاب Werewolf والبلاك جاك (Poker)، بهدف قياس قدرة نماذج الذكاء الاصطناعي على التعامل مع عدم اليقين، التفاعل الاجتماعي، واتخاذ المخاطر المحسوبة.

تفاصيل الخبر

تعتبر الألعاب أداة مهمة لتقييم قدرات الذكاء الاصطناعي، خصوصاً في بيئات غير مكتملة المعلومات. أضافت DeepMind ألعاب Werewolf وPoker إلى Game Arena لتوسيع نطاق الاختبارات خارج الشطرنج، الذي يعتمد على المعلومات الكاملة.

أبرز النقاط:

Chess: يقيس التفكير الاستراتيجي والتخطيط طويل المدى، مع تصدر نماذج Gemini 3 Pro وGemini 3 Flash للوحة الترتيب.
Werewolf: لعبة جماعية قائمة على اللغة الطبيعية تتطلب كشف الخداع وبناء التوافق مع الفريق، لاختبار مهارات التواصل والتفاوض.
Poker: يركز على اتخاذ قرارات مبنية على المخاطر وحساب الاحتمالات في مواجهة المعلومات غير المكتملة.
المنصة توفر بيئة آمنة لتجارب السلامة العملية للنماذج، بما يشمل اختبار قدراتها في الخداع وكشف التلاعب.
سيتم بث مباريات مباشرة مع تعليقات من خبراء الشطرنج والبلاك جاك، بما في ذلك Hikaru Nakamura وNick Schulman وDoug Polk وLiv Boeree.

الأهداف المستقبلية

تهدف التوسعة إلى تطوير نماذج AI أكثر قدرة على العمل في بيئات واقعية معقدة:

تحسين مهارات التفكير الاستراتيجي واتخاذ القرارات في ظروف عدم اليقين.
تعزيز قدرات النماذج في التفاعل الاجتماعي وفهم الدوافع البشرية.
اختبار التعامل مع المخاطر وحساب الاحتمالات بطريقة مشابهة للبشر.
توفير منصة معيارية لتقييم الأداء والابتكار في الذكاء الاصطناعي متعدد المهام.
دعم أبحاث السلامة العملية لبناء وكلاء AI موثوقين وفعّالين.

مع Kaggle Game Arena، تتحول الألعاب من مجرد وسيلة ترفيهية إلى مختبر حي لتقييم الذكاء الاصطناعي، مما يمكّن الباحثين من قياس وتحسين قدرات النماذج على التفكير والتفاعل واتخاذ القرار في العالم الحقيقي.