Gemini 2.5 Computer Use من جوجل وتفتح عصر التحكم الذكي

أعلنت شركة جوجل عن إطلاق نموذجها الجديد Gemini 2.5 Computer Use في نسخة المعاينة، وهو نموذج متطور قادر على التحكم بالمتصفح وتنفيذ المهام تلقائياً عبر التفاعل المباشر مع واجهات المستخدم.

تفاصيل الخبر

قدمت جوجل خلال هذا الأسبوع نموذج Gemini 2.5 Computer Use الذي يمثل نقلة نوعية في عالم النماذج التفاعلية. حيث يمكن للنموذج الآن فهم الواجهات الرسومية للمواقع الإلكترونية وتنفيذ الأوامر مثل النقر على الأزرار وملء النماذج والانتقال بين الصفحات دون تدخل بشري مباشر.

أبرز النقاط حولGemini 2.5 Computer Use:

يعتمد النموذج على تحليل لقطات الشاشة لفهم عناصر الصفحة وتنفيذ النقرات وأوامر الكتابة والتنقل.
تفوق على منافسيه، بما فيهم OpenAI Computer Using Agent وClaude Sonnet 4.5/4، في اختبارات الأداء على الويب والهواتف.
يتميز بجودة عالية وزمن استجابة منخفض مقارنة بالنماذج الأخرى في السوق.
تُستخدم إصدارات منه في مشروع Mariner وميزة AI Mode ضمن أدوات جوجل المتقدمة.

الأهداف المستقبلية

تسعى جوجل من خلالGemini 2.5 Computer Use إلى توسيع قدرات التفاعل الذكي بين الإنسان والحاسوب. ومن أبرز أهدافها القادمة:

تمكين النماذج الذكية من تنفيذ مهام معقدة على الإنترنت دون إشراف بشري.
تحسين دقة الفهم البصري لعناصر الويب لتقليل الأخطاء أثناء التشغيل.
دمج Gemini 2.5 في تطبيقات وخدمات جوجل المستقبلية لدعم الإنتاجية اليومية.
تطوير أدوات للمطورين تتيح استخدام واجهات Gemini API بسهولة أكبر.
تعزيز مفهوم الأتمتة الآمنة لضمان موثوقية الأداء وحماية بيانات المستخدمين.

إطلاق Gemini 2.5 Computer Use يمثل خطوة حقيقية نحو مستقبل تصبح فيه الحواسيب أكثر فهماً واستقلالية. وبينما تتسارع وتيرة التطور في نماذج الذكاء الاصطناعي، تثبت جوجل مجدداً ريادتها في بناء أدوات تفاعلية تغير شكل الإنتاج والعمل الرقمي.