صعود Poetiq على ARC-AGI-2 وتفوّقها على Gemini

يشهد مجال نماذج الذكاء الاصطناعي قفزة نوعية بعد نجاح شركة Poetiq الصغيرة في انتزاع صدارة اختبار ARC-AGI-2، متفوقة على نماذج ضخمة مثل Gemini 3 Deep Think بفضل نظامها الذكي القائم على تحسين النماذج المتاحة.

تفاصيل الخبر

تبدأ أهمية هذا الحدث من كونه يعيد تشكيل الطريقة التي ننظر بها لتطور القدرات العقلية الاصطناعية، خاصة مع دخول لاعبين صغار إلى ساحة المنافسة.

  • نظام Poetiq يعتمد على تنسيق نماذج جاهزة بدلاً من بناء نموذج جديد.
  • الفريق المكوّن من ستة أشخاص استخدم Gemini 3 Pro كقاعدة رئيسية.
  • النظام حقق نتيجة 54% في اختبار ARC-AGI-2 بتكلفة 30 دولاراً للمهمة.
  • النتيجة تتفوق على Gemini 3 Deep Think الذي سجّل 45% وبتكلفة 77 دولاراً.
  • هذه أول مرة يتجاوز فيها نظام الذكاء الاصطناعي حاجز 50% في هذا الاختبار.
  • قبل ستة أشهر فقط، كانت النماذج الرائدة تكافح لتصل إلى 5%.
  • يعتمد النظام على آلية تدقيق ذاتي لضمان جودة الإجابات.

الأهداف المستقبلية

تسعى Poetiq إلى دفع حدود الذكاء الاصطناعي عبر تطوير نظامها وتحسين قدراته في التكيف والجودة.

  • تعزيز قدرة النظام على التكيف السريع مع النماذج الجديدة.
  • تقليل التكلفة التشغيلية مع الحفاظ على مستوى الأداء.
  • توسيع آليات التدقيق الذاتي لتصبح أكثر استقلالية.
  • توظيف تقنيات orchestration للوصول إلى مستوى ذكاء أعلى دون الحاجة لنماذج عملاقة جديدة.
  • دفع سوق الذكاء الاصطناعي نحو حلول تعتمد على التنسيق بدلاً من القوة الحاسوبية فقط.

إن نجاح Poetiq يوضح أن مستقبل الذكاء الاصطناعي لن يتوقف على الشركات العملاقة وحدها، بل على الابتكار الذكي القادر على استغلال النماذج المتاحة بطرق أكثر فاعلية.

مقالات مشابهة