Command A Vision: مستقبل الذكاء الاصطناعي البصري للأعمال

أطلقت Cohere نموذج Command A Vision الذي يقدّم أداءً رائدًا في فهم الصور والمستندات داخل المؤسسات، مع كفاءة عالية في استهلاك الموارد ودعم لغوي متعدد.

تفاصيل الخبر

في خطوة جديدة نحو تمكين المؤسسات من الاستفادة من الذكاء الاصطناعي، أعلنت شركة Cohere عن إطلاق Command A Vision، وهو نموذج توليدي متعدد الوسائط مصمم خصيصًا لفهم البيانات البصرية والنصية داخل بيئة العمل. ويتميّز بقدرته على العمل بكفاءة عالية حتى على عتاد محدود.

أبرز القدرات التي يقدمها Command A Vision:

تحليل الرسوم والبيانات البصرية: فهم الرسوم البيانية والجداول والمخططات، وتطبيق المعرفة القطاعية في مجالات مثل التمويل والصحة والطاقة.
معالجة المستندات وفهمها بصريًا: استخراج البيانات من الفواتير والنماذج الممسوحة ضوئيًا، وفهم البنية التنظيمية للمستندات مع دعم إخراج البيانات بصيغة JSON.
فهم المشاهد الواقعية: تحليل الصور الواقعية، بما يشمل تحديد العلاقات والسياق والمخاطر ضمن البيئات الصناعية أو التجارية.
أداء قوي على المعايير القياسية: يتفوق على نماذج مثل GPT-4.1 وLlama 4 Maverick في اختبارات مثل DocVQA وTextVQA وOCRBench.
تشغيل مرن وآمن: يدعم النشر الداخلي (on-premise) باستخدام وحدتي GPU فقط، مما يجعله مناسبًا للقطاعات الخاضعة للتنظيم.