Google تطلق ميزات جديدة لإنشاء الصور في Gemini 2.0 Flash
كشفت Google عن تحديث جديد لنموذج Gemini 2.0 Flash، حيث أصبح بإمكان المستخدمين إنشاء وتحرير الصور مباشرةً من النموذج اللغوي دون الحاجة إلى نظام منفصل لتوليد الصور.

تفاصيل الخبر
يأتي تحديث Gemini Flash 2.0 ليضيف إمكانيات متقدمة لمعالجة الصور إلى جانب النصوص.
- نموذج 2.0-flash-exp متاح الآن عبر API وفي Google AI Studio، ويدعم كلاً من مخرجات الصور والنصوص مع إمكانية التعديل من خلال محادثة نصية.
- يعتمد Gemini على الفهم المتعدد الوسائط، مما يجعله قادرًا على الحفاظ على اتساق الشخصيات وفهم المفاهيم الحقيقية أثناء الحوار.
- يمكن للمستخدمين إنشاء قصة تحتوي على صور ثم تحسينها من خلال التعليمات النصية للوصول إلى النسخة المثالية.
- يتميز Flash 2.0 أيضًا بتقديم جودة عالية في عرض النصوص داخل الصور، مما يجعله مناسبًا لإنشاء الإعلانات والمنشورات على وسائل التواصل الاجتماعي والتصاميم النصية الأخرى.
الأهداف المستقبلية
تطمح Google من خلال هذه التقنية إلى إعادة تشكيل طريقة إنتاج المحتوى البصري باستخدام الذكاء الاصطناعي.
- دمج تحرير الصور مع النماذج اللغوية بدلاً من الاعتماد على أدوات منفصلة.
- تحسين التفاعل بين النصوص والصور لتقديم محتوى أكثر دقة واتساقًا.
- إحداث نقلة في التصميم والإعلانات من خلال تمكين المستخدمين من توليد تصاميم جاهزة باستخدام الأوامر النصية فقط.
يمثل تحديث Gemini Flash 2.0 خطوة كبيرة نحو توحيد معالجة النصوص والصور في نموذج واحد، مما يسهل عملية إنشاء المحتوى ويعزز الإبداع باستخدام الذكاء الاصطناعي.