Holo1.5: نماذج مفتوحة لتطوير وكلاء استخدام الحاسوب
كشفت الشركة المطورة لـHolo عن إصدار Holo1.5 كجيل جديد من نماذجها مفتوحة المصدر لوكلاء Computer Use، حيث حققت النماذج الجديدة قفزة دقة تتجاوز 10% مقارنة بالنسخة السابقة Holo1، مع إتاحة الأوزان على Hugging Face.

تفاصيل الخبر
إليك أبرز ما جاء في الإعلان:
- يتوفر Holo1.5 بثلاثة أحجام: 3B، 7B، و72B لتغطية احتياجات مختلفة من حيث الكفاءة والأداء.
- النماذج تقدم أداءً قياسيًا في مهام تحديد عناصر واجهة المستخدم (UI Localization)، متفوقة على نماذج مفتوحة مثل Qwen-2.5 VL ومغلقة مثل Sonnet 4.
- تحقق تفوقًا واضحًا في اختبارات ScreenSpot-Pro، التي تشمل بيئات احترافية مثل Photoshop وAutoCAD وVSCode.
- تدعم فهم واجهة المستخدم والإجابة على الأسئلة (UI VQA)، مثل: “أي تبويب نشط الآن؟” أو “هل المستخدم مسجّل دخول؟”، مما يعزز قدرة الوكلاء على تتبع السياق والتصرف بدقة.
- متاحة بشكل مفتوح مع واجهة تجريبية على Hugging Face Spaces وعروض مباشرة لكيفية التفاعل مع النماذج.
الأهداف المستقبلية
من خلال هذا الإصدار، تسعى Holo إلى:
- بناء وكلاء استخدام حاسوب عامّة وموثوقة قادرة على التفاعل مع البرامج بنفس أسلوب البشر.
- تحقيق توازن بين الكفاءة والتكلفة لتشجيع اعتماد هذه التقنية في المؤسسات والأفراد.
- تعزيز قدرات النماذج في الملاحة الدقيقة، الفهم السياقي، واتخاذ القرارات في بيئات متعددة المنصات (ويب، موبايل، سطح المكتب).
- التوسع خلال الأسابيع المقبلة عبر إطلاق أدوات ووكلاء جدد مبنيين على نماذج Holo.
مع Holo1.5، يقترب العالم خطوة جديدة نحو وكلاء حوسبة عامة يستطيعون الرؤية، الفهم، والتنفيذ داخل بيئات العمل الرقمية. هذه النماذج تضع الأساس لتجربة أكثر طبيعية وموثوقية في التفاعل مع البرمجيات، وتجعل مفهوم Computer Use Agents أقرب من أي وقت مضى إلى التطبيق العملي.
