Kimi-Researcher: نموذج الذكاء الاصطناعي الذي يتعلم بالتجربة

أعلنت Kimi عن إطلاق Kimi-Researcher، وكيل ذكي مدعوم بالتعلم التعزيزي الكامل، قادر على إجراء بحوث عميقة ومتعددة الخطوات باستخدام أدوات وتخطيط متقدم.

ما هو Kimi-Researcher وما الذي يجعله مختلفًا؟

يأتي Kimi-Researcher كنقلة نوعية في عالم الوكلاء الذكيين، حيث تم تدريبه بالكامل باستخدام التعلم التعزيزي بنهاية إلى نهاية (End-to-End RL)، ما يسمح له بالتفكير المستقل، التكيف مع البيئات المتغيرة، واستخدام أدوات مختلفة لحل المهام المعقدة.

  • يعتمد على نموذج داخلي من سلسلة “k” الخاصة بـ Kimi.
  • يحقق 26.9% Pass@1 على اختبار Humanity’s Last Exam، و40.17% على Pass@4.
  • يستخدم أكثر من 200 رابط ويب و23 خطوة استدلال في كل مهمة.
  • يتفوق على نماذج مثل o3 على اختبارات XBench-DeepSearch، Seal-0، وSimpleQA.
  • يستخدم أدوات فعالة مثل متصفح نصي، أداة تنفيذ أكواد، وأداة بحث داخلي متزامن.

الأهداف المستقبلية للنموذج

قبل الإطلاق العام الكامل، تم تحديد مجموعة من الأهداف الطموحة لتوسيع قدرات Kimi-Researcher:

  • تحويله إلى وكيل عام متعدد المهام، قادر على التعامل مع الاستفسارات البحثية، البرمجة، التحليل، والردود الاستنتاجية.
  • إضافة أدوات جديدة تشمل بيئات تفاعلية أكثر تطورًا لتنفيذ المهام المعقدة.
  • تحسين بنية التعلم التعزيزي ليكون أكثر استقرارًا وكفاءة عبر إدارة السياق والذاكرة بذكاء.
  • فتح مصدر النموذج تدريجيًا للمجتمع البحثي لتوسيع نطاق التجربة وتطويره بشكل مشترك.

يمثّل Kimi-Researcher نقطة تحول في تطوير الوكلاء الذكيين، حيث يجمع بين الاستدلال، التعلّم، واستخدام الأدوات في نموذج واحد. هذه ليست سوى البداية نحو وكلاء قادرين على التفكير والتحليل الذاتي بفعالية وعمق.

مقالات مشابهة