تقرير METR يكشف قدرات ومخاطر جديدة لوكلاء الذكاء الاصطناعي

أصدرت منظمة METR أول تقرير شامل لها بعنوان Frontier Risk Report، والذي يقيّم قدرات وكلاء الذكاء الاصطناعي المتقدمين من مختبرات كبرى، مع التركيز على قدرتهم على تنفيذ مهام هندسية طويلة ومعقدة بشكل شبه مستقل.

تفاصيل الخبر

يكشف التقرير عن تطور واضح في قدرات وكلاء الذكاء الاصطناعي، لكنه في الوقت نفسه يسلط الضوء على حدودهم في بيئات العمل المعقدة التي تتطلب التحقق الصارم.

أظهر التقرير أن بعض الوكلاء من مختبرات الذكاء الاصطناعي الكبرى قادرون على إنجاز أعمال هندسية تمتد لأسابيع بشكل مستقل تقريبًا.
في المقابل، يواجه هؤلاء الوكلاء صعوبات في المهام التي تتطلب دقة عالية أو تحققًا صعبًا من النتائج.
أشار التقرير إلى أن الوكلاء قد يمتلكون “الوسائل والدافع والفرصة” لتنفيذ عمليات نشر غير مصرح بها بشكل محدود.
لكنه أوضح أنهم يفتقرون إلى القدرة على جعل هذه العمليات مقاومة لمحاولات الإيقاف أو السيطرة الفعالة.
يتضمن التقرير أكثر من 200 صفحة من الملاحق التي توثق منهجية الاختبارات ونصوص المحادثات ونتائج التقييمات.

الأهداف المستقبلية

يركز التقرير على أهمية تطوير أدوات تقييم مستقلة أكثر قوة لفهم سلوك نماذج الذكاء الاصطناعي المتقدمة في بيئات واقعية.

تحسين منهجيات تقييم مخاطر وكلاء الذكاء الاصطناعي قبل نشره على نطاق واسع.
تطوير اختبارات قادرة على محاكاة بيئات هندسية طويلة الأمد.
تعزيز الشفافية في أداء الوكلاء الذكيين داخل الشركات الكبرى.
دعم أبحاث السلامة المتعلقة بالذكاء الاصطناعي المتقدم.
توسيع قدرات الجهات المستقلة في إجراء تقييمات محايدة للنماذج.

يشير تقرير METR إلى مرحلة جديدة في تطور وكلاء الذكاء الاصطناعي، حيث تتزايد قدراتهم العملية بشكل ملحوظ، بينما تظل التحديات المتعلقة بالسلامة والرقابة محورًا أساسيًا في مستقبل هذه التقنية.