اختبار ARC-AGI-3 الجديد يفضح حدود الذكاء الاصطناعي

يشهد عالم الذكاء الاصطناعي تطورًا سريعًا، لكن اختبار ARC-AGI-3 الجديد كشف فجوة كبيرة بين قدرات البشر والأنظمة المتقدمة، حيث فشلت النماذج الحديثة في تحقيق نتائج تُذكر مقارنة بالأداء البشري.

تفاصيل الخبر

يأتي هذا التطور الجديد من اختبار ARC-AGI-3 من مؤسسة ARC Prize بقيادة الباحث François Chollet، حيث تم إطلاق نسخة أكثر تعقيدًا من اختبار ARC لقياس قدرات التفكير الحقيقي لدى الأنظمة الذكية.

يعتمد الاختبار على سيناريوهات تفاعلية تشبه الألعاب دون أي تعليمات مسبقة
يتطلب من النماذج اكتشاف القواعد وبناء استراتيجيات من الصفر
حقق نموذج Gemini Pro أعلى نتيجة بنسبة 0.37% فقط
سجل نموذج GPT 5.4 High نسبة 0.26%، بينما جاء Opus 4.6 بنسبة 0.25%
فشل نموذج Grok-4.20 في تحقيق أي نتيجة تُذكر (0%)
يستطيع البشر حل 100% من المهام من المحاولة الأولى
ارتفعت نتائج النسخة السابقة ARC-AGI-2 من 3% إلى 50% خلال أقل من عام
تم تخصيص جائزة مالية بقيمة مليون دولار لتحفيز التقدم في هذا المجال

الأهداف المستقبلية

يسعى هذا الاختبار إلى إعادة تعريف مفهوم الذكاء الاصطناعي الحقيقي، بعيدًا عن مجرد تحسين الأداء عبر البيانات الضخمة.

قياس القدرة على التفكير العام وليس الحفظ أو التكرار
التمييز بين الفهم الحقيقي والحلول القائمة على القوة الحسابية
دفع الشركات مثل Google وOpenAI لتطوير نماذج أكثر ذكاءً واستقلالية
تحفيز أبحاث الذكاء الاصطناعي للوصول إلى مستوى أقرب للفهم البشري
اختبار حدود النماذج الحالية وتحديد نقاط ضعفها بدقة

في النهاية، يوضح ARC-AGI-3 أن الطريق نحو الذكاء الاصطناعي العام لا يزال طويلًا، وأن التفوق البشري في التفكير المرن والإبداعي لم يتم تجاوزه بعد، رغم كل التقدم التقني الحالي.