Google Deep Think يتصدر اختبارات الاستدلال عالميًا

أطلقت جوجل تحديثًا كبيرًا لوضع الاستدلال Deep Think ضمن Gemini 3، محققة قفزات لافتة في اختبارات الرياضيات والبرمجة والعلوم. النتائج الجديدة تعيد الشركة إلى صدارة مشهد النماذج المتقدمة في 2026.

تفاصيل الخبر

أعلنت Google عن تحديث رئيسي لوضع Deep Think في Gemini 3، مع أرقام أداء وصفت بأنها من بين الأعلى في تاريخ اختبارات الاستدلال.

  • سجل 84.6% في اختبار ARC-AGI-2، متفوقًا على Anthropic Opus 4.6 (68.8%) وOpenAI GPT-5.2 (52.9%).
  • حقق 48.4% في اختبار Humanity’s Last Exam، وهو أعلى رقم مسجل حتى الآن.
  • أحرز مستوى الميدالية الذهبية في أولمبياد الفيزياء والكيمياء لعام 2025.
  • سجل 3,455 نقطة Elo على منصة Codeforces، بفارق يقارب 1,000 نقطة عن Opus 4.6.
  • كشفت جوجل أيضًا عن وكيل رياضي جديد باسم Aletheia قادر على حل مسائل مفتوحة والتحقق من البراهين بشكل ذاتي، مع أداء قياسي في عدة مجالات تخصصية.
  • التحديث متاح حاليًا لمشتركي Google AI Ultra داخل تطبيق Gemini، مع إتاحة واجهة API للباحثين عبر برنامج وصول مبكر.

تشير هذه النتائج إلى تقدم واضح في قدرات الاستدلال العميق، خاصة في المسائل المعقدة متعددة الخطوات التي تتطلب فهمًا تجريديًا عالي المستوى.

الأهداف المستقبلية

يركز هذا التحديث على توسيع حدود الذكاء الاصطناعي في المجالات العلمية والبحثية، عبر:

  • تعزيز قدرات حل المشكلات المفتوحة في الرياضيات والعلوم النظرية.
  • دعم الباحثين بأدوات قادرة على التحقق من البراهين وتحليل الفرضيات.
  • رفع مستوى الأداء في البرمجة التنافسية وتطوير البرمجيات المعقدة.
  • ترسيخ موقع جوجل كمنافس رئيسي في سباق النماذج الرائدة.

تؤكد هذه القفزة أن سباق الذكاء الاصطناعي لا يزال مفتوحًا، وأن الحدود في مجالات الرياضيات والعلوم تتحرك بسرعة نحو مستويات غير مسبوقة.

في الختام، يعكس Deep Think مرحلة جديدة من نماذج الاستدلال المتقدم، حيث لم تعد المنافسة تقتصر على المحادثة، بل تمتد إلى حل أعقد المسائل العلمية بدقة تقترب من مستوى الخبراء.

مقالات مشابهة