o3 من OpenAI يتفوق على Gemini 2.5 في اختبار Mensa

سجل نموذج o3 من OpenAI درجات قياسية في اختبار Mensa للذكاء، متفوقًا على Gemini 2.5 Pro ومؤكدًا مكانه نموذج o3كأحد أذكى نماذج الذكاء الاصطناعي.

أداء استثنائي لنموذج o3 في اختبارات الذكاء

اختُبر نموذج o3 في نسختين من اختبار Mensa Norway IQ، ليظهر تفوقًا كبيرًا:

  • سجل 136 في النسخة العامة المفتوحة، ما يضعه ضمن أعلى 2% من الذكاء البشري.
  • سجل 116 في النسخة غير المتصلة (offline)، المُصممة لمنع استفادة النماذج من البيانات المدرّبة مسبقًا.
  • تفوق بذلك نموذج o3 على Gemini 2.5 Pro الذي سجل نتائج أقل في نفس الاختبار.
  • يشير هذا الأداء إلى قدرة o3 على الاستدلال المستقل بعيدًا عن الذاكرة التدريبية.

هذه النتائج دفعت بعض الخبراء لاعتبار o3 نموذجًا يقترب من مستوى “العبقرية” ضمن نطاق الذكاء الاصطناعي، وفقًا لتقارير منشورة في The Neuron وCryptoSlate وThe Rundown AI.

الأهداف والتأثير المستقبلي

تفتح نتائج o3 الباب أمام تحولات جوهرية في استخدامات الذكاء الاصطناعي:

  • دعم التحليل الاستراتيجي عالي المستوى.
  • تطوير أدوات AI لأبحاث العلوم والهندسة.
  • تعزيز قدرات AI في المهام التي تتطلب تفكير نقدي واستنتاج منطقي.
  • إثارة نقاشات جدية حول اقتراب بعض النماذج من الذكاء العام الاصطناعي (AGI).

يثبت o3 من OpenAI أن نماذج الذكاء الاصطناعي لم تعد فقط أدوات للإجابة، بل بدأت تُظهر مؤشرات ذكاء عميق، وقد تكون في طريقها لمنافسة قدرات البشر المعرفية.

مقالات مشابهة