Alibaba تطلق QVQ-Max: نموذج متقدم للاستدلال البصري

أعلنت شركة Alibaba عن إطلاق QVQ-Max، وهو نموذج جديد للاستدلال البصري يتجاوز التعرف التقليدي على الصور، حيث يمكنه تحليل المعلومات البصرية والتفكير المنطقي عبر الصور ومقاطع الفيديو.

تفاصيل الخبر

يعد QVQ-Max تطورًا جديدًا في سلسلة نماذج Qwen، حيث يعزز القدرات البصرية في مجالات متعددة.

  • يعتمد على نسخة مطورة من QVQ-72B-Preview، مما يتيح تحسينات في حل المشكلات الرياضية، وتوليد الأكواد، والمهام الإبداعية.
  • يتميز بآلية “التفكير” القابلة للتعديل، مما يعزز دقة الاستنتاجات مع زيادة وقت التحليل.
  • يقدم قدرات متقدمة مثل تحليل المخططات الهندسية، وحل مسائل الرياضيات، وتقديم ملاحظات على الرسومات المقدمة من المستخدمين.
  • تخطط Qwen لإنشاء وكيل بصري متكامل قادر على تشغيل الأجهزة وأداء مهام تفاعلية مثل لعب الألعاب.

الأهداف المستقبلية

تسعى Alibaba إلى:

  • تعزيز قدرات الذكاء الاصطناعي في التحليل البصري والاستدلال المنطقي.
  • تطوير نماذج ذكاء اصطناعي قادرة على التفاعل مع العالم الحقيقي.
  • تضييق الفجوة بين تقنيات الذكاء الاصطناعي في الصين والولايات المتحدة.
  • تقديم حلول متقدمة في المجالات الهندسية والإبداعية عبر الذكاء الاصطناعي.

مع إطلاق QVQ-Max، تؤكد Alibaba ريادتها في مجال الذكاء الاصطناعي البصري، مما يعزز المنافسة العالمية ويدفع حدود الابتكار في الاستدلال البصري وتحليل البيانات.

مقالات مشابهة