أداء Gemini 3 Pro في اختبار Tracking AI: ماذا تعني نتيجة 130؟

سجّل Gemini 3 Pro من Google نتيجة 130 نقطة على اختبار “Offline IQ test” الذي يجريه موقع Tracking AI، متقدّماً على Grok 4 Expert Mode الذي حقق 126 نقطة. هذه النتيجة أثارت نقاشاً واسعاً على الإنترنت، بما في ذلك في Reddit وغيرها من المجتمعات التقنية.

ما الذي يقيسه Tracking AI؟

تركّز منصة Tracking AI على نوعين من الاختبارات:

الاختبار غير المنشور (Offline Test)
يُفترض أنه غير متاح على الإنترنت ولم يكن ضمن بيانات تدريب النماذج
(كما ورد في GIGAZINE وReddit).
نسخة من اختبار Mensa Norway
وهي متاحة علناً على الإنترنت
(Jeuxvideo.com وTOUCHIT).

كما ينشر الموقع نتائج اختبار الانحياز السياسي لكافة النماذج، بهدف تقييم الاتجاهات السياسية المحتملة في الاستجابات

لماذا يستحق الأمر التريّث قبل اعتبار 130 “ذكاءً استثنائياً”؟

تشير مراجعات مختلفة إلى عدة تحفظات:

اختبار Mensa Norway متاح على الإنترنت، ما يعني أنّ بعض الأسئلة قد تكون ضمن بيانات تدريب النماذج، وبالتالي قد تعتمد النتيجة على “تذكّر” وليس استدلالاً حقيقياً
حتى الاختبار غير المنشور (Offline) قد لا يضمن تماماً عدم تسريب الأسئلة أو وجودها بشكلٍ غير مباشر ضمن البيانات الضخمة المستخدمة لتدريب النماذج
اختبارات IQ — سواء للبشر أو للنماذج — ليست معياراً علمياً دقيقاً لقياس قدرات الذكاء الشامل كالفهم العميق أو الإبداع

خلاصة التقييم

نتيجة 130 في اختبار Tracking AI لنموذج Gemini 3 Pro تُعد مؤشراً قوياً على تقدّم Gemini 3 Pro في حل الألغاز المنطقية والاستدلالية. لكنها:

لا تعني امتلاك النموذج “ذكاءً بشرياً” بالمعنى الكامل.
ولا تقدّم دليلاً على فهم عميق أو إبداع علمي حقيقي.
بل تمثل نقطة بيانات مهمة ضمن تطوّر نماذج الذكاء الاصطناعي، مع ضرورة مراعاة قيود ومنهجية الاختبارات نفسها.