Kimi-Researcher: نموذج الذكاء الاصطناعي الذي يتعلم بالتجربة
أعلنت Kimi عن إطلاق Kimi-Researcher، وكيل ذكي مدعوم بالتعلم التعزيزي الكامل، قادر على إجراء بحوث عميقة ومتعددة الخطوات باستخدام أدوات وتخطيط متقدم.

ما هو Kimi-Researcher وما الذي يجعله مختلفًا؟
يأتي Kimi-Researcher كنقلة نوعية في عالم الوكلاء الذكيين، حيث تم تدريبه بالكامل باستخدام التعلم التعزيزي بنهاية إلى نهاية (End-to-End RL)، ما يسمح له بالتفكير المستقل، التكيف مع البيئات المتغيرة، واستخدام أدوات مختلفة لحل المهام المعقدة.
- يعتمد على نموذج داخلي من سلسلة “k” الخاصة بـ Kimi.
- يحقق 26.9% Pass@1 على اختبار Humanity’s Last Exam، و40.17% على Pass@4.
- يستخدم أكثر من 200 رابط ويب و23 خطوة استدلال في كل مهمة.
- يتفوق على نماذج مثل o3 على اختبارات XBench-DeepSearch، Seal-0، وSimpleQA.
- يستخدم أدوات فعالة مثل متصفح نصي، أداة تنفيذ أكواد، وأداة بحث داخلي متزامن.
الأهداف المستقبلية للنموذج
قبل الإطلاق العام الكامل، تم تحديد مجموعة من الأهداف الطموحة لتوسيع قدرات Kimi-Researcher:
- تحويله إلى وكيل عام متعدد المهام، قادر على التعامل مع الاستفسارات البحثية، البرمجة، التحليل، والردود الاستنتاجية.
- إضافة أدوات جديدة تشمل بيئات تفاعلية أكثر تطورًا لتنفيذ المهام المعقدة.
- تحسين بنية التعلم التعزيزي ليكون أكثر استقرارًا وكفاءة عبر إدارة السياق والذاكرة بذكاء.
- فتح مصدر النموذج تدريجيًا للمجتمع البحثي لتوسيع نطاق التجربة وتطويره بشكل مشترك.
يمثّل Kimi-Researcher نقطة تحول في تطوير الوكلاء الذكيين، حيث يجمع بين الاستدلال، التعلّم، واستخدام الأدوات في نموذج واحد. هذه ليست سوى البداية نحو وكلاء قادرين على التفكير والتحليل الذاتي بفعالية وعمق.
