اختبار جديد: نماذج الذكاء الاصطناعي تتحرى في لعبة Ace Attorney

أجرى باحثو مختبر Hao AI بجامعة كاليفورنيا تجربة فريدة لاختبار قدرات نماذج الذكاء الاصطناعي في لعب لعبة “Ace Attorney” وكشف الأدلة.

تفاصيل الخبر

اختبر فريق من جامعة UC San Diego نماذج ذكاء اصطناعي رائدة من بينها GPT-4.1 وGemini 2.5 Pro، من خلال محاكاة دور شخصية “فينيكس رايت” في لعب لعبة “Ace Attorney”، المحامي الذي يحلل الأدلة ويستجوب الشهود لحل القضايا.

أبرز نتائج التجربة لاختبار قدرات الذكاء الاصطناعي في لعبة Ace Attorney:

  • تم تكليف النماذج بمقارنة شهادات الشهود بالأدلة واكتشاف الثغرات في القضايا.
  • نموذج OpenAI o1 كان الأفضل أداءً، حيث حدد 26 دليلًا صحيحًا وبلغ المستوى الرابع.
  • Gemini 2.5 Pro جاء في المرتبة الثانية بـ 20 دليلًا صحيحًا.
  • باقي النماذج فشلت في تقديم حتى 10 أدلة صحيحة للقاضي.
  • المفاجأة كانت أداء GPT-4.1 الضعيف، حيث تطابق مع نموذج Claude 3.5 Sonnet، وكلاهما حدّد فقط 6 أدلة صحيحة.

الأهداف المستقبلية

تُظهر اختبار قدرات الذكاء الاصطناعي في لعبة Ace Attorney إمكانيات الذكاء الاصطناعي في المجالات التي تتطلب تحليلًا منطقيًا وتفكيرًا تسلسليًا عبر سياقات معقدة.

  • استخدام الألعاب التفاعلية كميدان لاختبار قدرات الاستنتاج، والفهم البصري، وربط الأدلة.
  • تحسين قدرة النماذج على التفكير السياقي الطويل واتخاذ القرارات اللحظية.
  • تطوير نماذج جديدة يمكنها فهم العلاقات السببية والزمانية بين الأحداث داخل سيناريوهات معقدة.
  • تعزيز التفاعل بين الذكاء الاصطناعي والألعاب التعليمية أو التفاعلية كوسيلة للتدريب أو التقييم.

تؤكد نتائج هذا الاختبار أن الذكاء الاصطناعي في لعبة Ace Attorney لا يزال أمامه طريق لتعلم مهارات التحليل والتحقيق المعقدة، لكنها أيضًا تفتح الباب أمام تطورات مثيرة في استخدام الألعاب التفاعلية في البحث العلمي.

مقالات مشابهة