GPT-5.2 Pro يحطم رقمًا قياسيًا باختبارات الرياضيات المتقدمة

حقق نموذج GPT-5.2 Pro من OpenAI قفزة لافتة في اختبارات التفكير الرياضي، بعدما سجّل نتيجة غير مسبوقة على معيار FrontierMath، ما يعزز مكانته كأقوى نموذج للرياضيات والعلوم حتى الآن.

تفاصيل الخبر

يعكس هذا الإنجاز تقدمًا حقيقيًا في قدرات النماذج اللغوية على التعامل مع مسائل رياضية وعلمية شديدة التعقيد، وهي فئة من الاختبارات لطالما شكّلت تحديًا كبيرًا للذكاء الاصطناعي.

سجّل GPT-5.2 Pro نسبة 29% على معيار FrontierMath Tier 4 التابع لـ Epoch AI.
تمثل هذه النتيجة تفوقًا بفارق 10% كاملة عن الرقم القياسي السابق الذي حققه نموذج Gemini 3 Pro.
يُعد Tier 4 أعلى مستويات اختبار FrontierMath، ويُستخدم لقياس القدرة على الاستدلال العميق في مسائل رياضية متقدمة.
بحسب موقع FrontierMath، فإن النجاح في هذا المستوى يُعد مؤشرًا على قدرة الذكاء الاصطناعي على أداء التفكير المعقد المطلوب لتحقيق اختراقات علمية حقيقية.
رغم تسجيل انخفاض طفيف لاحقًا في النتيجة، إلا أن GPT-5.2 Pro ما زال يُصنّف كأقوى نموذج في الرياضيات مقارنة بجميع النماذج المنافسة.
يشير باحثون ومتابعون إلى أن هذا الأداء يعكس قوة النموذج في مجالات الفيزياء، والهندسة، وعلوم الحوسبة النظرية، وليس الرياضيات فقط.

الأهداف المستقبلية

يمثل هذا التقدم خطوة مهمة ضمن مسار أوسع تسعى فيه OpenAI إلى دفع حدود ما يمكن للذكاء الاصطناعي تحقيقه في البحث العلمي.

الاقتراب من مستوى الذكاء القادر على المساهمة في اكتشافات علمية جديدة.
دعم الباحثين في حل مسائل رياضية ونظرية عالية التعقيد.
تسريع التقدم في مجالات العلوم الدقيقة والهندسة المتقدمة.
اختبار حدود الاستدلال طويل المدى تمهيدًا للوصول إلى نماذج أكثر عمقًا.

الخاتمة:
نتائج GPT-5.2 Pro على FrontierMath لا تمثل مجرد رقم قياسي جديد، بل إشارة قوية إلى أن الذكاء الاصطناعي يقترب تدريجيًا من لعب دور فعلي في مستقبل الاكتشافات العلمية.