Hugging Face تطلق Open Computer Agent
أعلنت Hugging Face عن إطلاق Open Computer Agent، عميل ذكاء اصطناعي مجاني بطيء نسبيًا، قادر على تنفيذ مهام متعددة الخطوات عبر حاسوب سحابي باستخدام VM وتطبيقات مثبتة مسبقًا. الأداة تأتي ضمن مبادرة “smolagents” مفتوحة المصدر، وتتيح للمطورين تجربة كيفية استخدام النماذج الحالية لإدارة مهام يومية بدون لمس الماوس.

تفاصيل الخبر
أداة Open Computer Agent تُشغّل عبر متصفح الإنترنت وتستخدم آلة افتراضية (Linux VM) مزودة ببرامج مثل Firefox.
- تنفيذ المهام اليومية: يمكن للوكيل تنفيذ إجراءات متعددة الخطوات مثل ملء النماذج، حجز التذاكر، التحقق من الاتجاهات، وإنشاء مستندات تقنية، من خلال محاكاة حركات الماوس ولوحة المفاتيح.
- تشغيل دائم في السحابة: يظل الوكيل يعمل حتى بعد إغلاق جهاز المستخدم، مع أوقات انتظار متفاوتة حسب ضغط الاستخدام.
- نموذج ذكاء اصطناعي متقدم: يعتمد على Qwen2-VL-72B، وهو نموذج رؤيوي-لغوي قادر على تحليل الشاشة والتفاعل مع العناصر بدقة بناءً على مواقعها.
- قيود حالية: الأداة فعالة في المهام الأساسية، لكنها تواجه صعوبة في التعامل مع التعقيدات مثل اختبارات CAPTCHA.
الأهداف المستقبلية
تسعى Hugging Face إلى:
- تحسين الأداء ليصبح أسرع بمقدار 10x.
- توسيع التكامل مع أدوات ومنصات المطورين عبر واجهات برمجة التطبيقات (APIs).
- تطوير الوكلاء الذكيين ليتمكنوا من العمل بفعالية ضمن بيئات الإنتاج البرمجية.
يمثل Open Computer Agent تجربة رائدة في تطوير وكلاء ذكاء اصطناعي حاسوبيين، والذين يمكنهم تنفيذ مهام معقدة دون تدخل يدوي. وبينما لا يزال في مراحله الأولى، فإن هذا الوكيل يفتح الباب أمام مستقبل يعتمد فيه المستخدمون على الذكاء الاصطناعي في أتمتة التفاعل مع الحاسوب بشكل كامل.
