نظام Poetiq يكسر حواجز الذكاء العام بنتيجة 75% على ARC-AGI-2

حقق نظام Poetiq إنجازاً غير مسبوق بتسجيله 75% في اختبار ARC-AGI-2 باستخدام نموذج GPT-5.2 X-High، متجاوزاً المتوسط البشري البالغ 60%، ومحطماً الأرقام القياسية السابقة بفارق هائل.

تفاصيل تفوق Poetiq في اختبارات الاستدلال التجريدي المعقدة

يمثل هذا الإنجاز تحولاً من الاعتماد على “حجم النموذج” إلى “ذكاء النظام”؛ حيث أثبتت التجربة أن دمج نموذج قوي مع إطار عمل (Harness) ذكي هو المفتاح لحل أصعب معضلات الذكاء الاصطناعي:

  • تجاوز العتبة البشرية: تعد هذه المرة الأولى التي يتم فيها كسر حاجز الـ 70% في اختبار ARC-AGI-2، وهو الاختبار المصمم خصيصاً ليكون “سهلاً للبشر وصعباً جداً على الآلات”.
  • كفاءة التكلفة مقابل الأداء: تمكن النظام من تحقيق هذه النتيجة المذهلة بتكلفة منخفضة بلغت أقل من 8 دولارات للمسألة الواحدة، متفوقاً على أنظمة “Brute-force” التي تتجاوز تكاليفها أضعاف هذا الرقم.
  • الاعتماد على “Harness” ذكي: لم يتم تدريب النموذج من جديد، بل استخدم Poetiq نظاماً تكرارياً (Recursive Self-Improvement) يقوم ببناء نماذج ذهنية للحل، اختبارها، وتصحيحها ذاتياً قبل تقديم الإجابة النهائية.
  • التفوق على المنافسين: حقق النموذج قفزة بنسبة 15% عن أقرب منافسيه (مثل Gemini 3 وGPT-5.1)، مما يثبت أن القدرات الكامنة في سلسلة GPT-5.2 يمكن استخراجها بشكل أفضل عبر أنظمة الأتمتة المتقدمة.
  • القدرة على التعميم: أظهر التحليل أن النظام لا يعتمد على الحفظ، بل على “الاستدلال السائل” (Fluid Reasoning)، وهي القدرة على حل مشكلات بصرية ومنطقية لم يسبق للنموذج رؤيتها في بيانات التدريب.

الأهداف المستقبلية لنظام Poetiq في تطوير الذكاء الاصطناعي العام

يضع هذا النجاح شركة Poetiq وفريق تطوير GPT-5.2 أمام آفاق جديدة تهدف إلى تحويل هذه النتائج المختبرية إلى تطبيقات واقعية خلال عام 2026:

  • الوصول إلى دقة 85%: يسعى الفريق لتحقيق النسبة المطلوبة للفوز بجائزة “ARC Prize” الكبرى، مما سيعني رسمياً أن الذكاء الاصطناعي قد تساوى مع القدرات الإدراكية العليا للبشر في التجريد.
  • تطوير وكلاء مستقلين للصناعة: تهدف الخطة المستقبلية لاستخدام هذا النظام في حل مشكلات معقدة في مجالات البرمجيات، البيولوجيا، والبحث العلمي التي تتطلب استدلالاً طويل الأمد وتصحيحاً ذاتياً.
  • تقليل الاعتماد على التدريب المكثف: التركيز على طبقات “التحقق والمنطق” (Validation Layers) التي تعمل فوق النماذج الجاهزة، مما يقلل الحاجة لعمليات إعادة تدريب النماذج الضخمة والمكلفة طاقياً.
  • بناء أنظمة “الاستدلال المستمر”: العمل على جعل الذكاء الاصطناعي قادراً على التعلم من كل مهمة يحلها وتطوير استراتيجياته الخاصة بشكل تراكمي دون تدخل بشري.

لقد أثبت Poetiq أن الطريق نحو الذكاء الاصطناعي العام (AGI) لا يمر فقط عبر زيادة البيانات، بل عبر بناء أنظمة قادرة على “التفكير” والمراجعة، محولاً الألغاز المستعصية إلى مهام روتينية تُحل في ثوانٍ.

مقالات مشابهة