Alibaba تطلق QVQ-Max: نموذج متقدم للاستدلال البصري
أعلنت شركة Alibaba عن إطلاق QVQ-Max، وهو نموذج جديد للاستدلال البصري يتجاوز التعرف التقليدي على الصور، حيث يمكنه تحليل المعلومات البصرية والتفكير المنطقي عبر الصور ومقاطع الفيديو.

تفاصيل الخبر
يعد QVQ-Max تطورًا جديدًا في سلسلة نماذج Qwen، حيث يعزز القدرات البصرية في مجالات متعددة.
- يعتمد على نسخة مطورة من QVQ-72B-Preview، مما يتيح تحسينات في حل المشكلات الرياضية، وتوليد الأكواد، والمهام الإبداعية.
- يتميز بآلية “التفكير” القابلة للتعديل، مما يعزز دقة الاستنتاجات مع زيادة وقت التحليل.
- يقدم قدرات متقدمة مثل تحليل المخططات الهندسية، وحل مسائل الرياضيات، وتقديم ملاحظات على الرسومات المقدمة من المستخدمين.
- تخطط Qwen لإنشاء وكيل بصري متكامل قادر على تشغيل الأجهزة وأداء مهام تفاعلية مثل لعب الألعاب.
الأهداف المستقبلية
تسعى Alibaba إلى:
- تعزيز قدرات الذكاء الاصطناعي في التحليل البصري والاستدلال المنطقي.
- تطوير نماذج ذكاء اصطناعي قادرة على التفاعل مع العالم الحقيقي.
- تضييق الفجوة بين تقنيات الذكاء الاصطناعي في الصين والولايات المتحدة.
- تقديم حلول متقدمة في المجالات الهندسية والإبداعية عبر الذكاء الاصطناعي.
مع إطلاق QVQ-Max، تؤكد Alibaba ريادتها في مجال الذكاء الاصطناعي البصري، مما يعزز المنافسة العالمية ويدفع حدود الابتكار في الاستدلال البصري وتحليل البيانات.