Qwen-Image-2512: نموذج Alibaba الجديد يرفع واقعية الصور

كشفت Alibaba عبر فريق Qwen عن نموذج Qwen-Image-2512 لتوليد الصور من النص، مع تحسينات واضحة في الواقعية، ودقة التفاصيل، وجودة عرض النصوص، ما يجعله من أقوى النماذج المفتوحة حاليًا.

تفاصيل الخبر

يمثل Qwen-Image-2512 تحديث ديسمبر لنموذج Qwen-Image الأساسي، ويعكس قفزة تقنية ملحوظة مقارنة بالإصدار الذي أُطلق في أغسطس، سواء على مستوى الجودة البصرية أو القدرة على تنفيذ التعليمات المعقدة.

  • النموذج مخصص لمهام Text-to-Image، وهو مفتوح المصدر بترخيص Apache-2.0.
  • يقدّم واقعية أعلى للبشر، مع تقليل واضح لما يُعرف بـ “الطابع الاصطناعي” في الوجوه وتفاصيل البشرة والشعر.
  • يعرض تفاصيل طبيعية أدق في المناظر الطبيعية، المياه، النباتات، وفراء الحيوانات.
  • شهد تحسنًا كبيرًا في عرض النصوص داخل الصور، من حيث الدقة، التخطيط، والدمج بين النص والعناصر البصرية.
  • أظهرت اختبارات AI Arena، بعد أكثر من 10,000 جولة تقييم أعمى، أن Qwen-Image-2512 يُعد أقوى نموذج مفتوح المصدر حاليًا، مع قدرة تنافسية حتى أمام نماذج مغلقة المصدر.
  • يدعم الإنجليزية والصينية، ويتكامل بسهولة مع مكتبة Diffusers من Hugging Face، ما يجعله عمليًا للمطورين والباحثين.

الأهداف المستقبلية

تسعى Alibaba من خلال هذا النموذج إلى ترسيخ موقع Qwen كمنصة أساسية في مجال توليد الصور، مع التركيز على الاستخدامات الواقعية والتجارية.

  • توفير نموذج مفتوح عالي الجودة يمكن الاعتماد عليه في الإنتاج.
  • دعم تطبيقات التصميم، التسويق، التعليم، والعروض التقديمية.
  • تحسين الدمج بين النص والصورة في السيناريوهات المعقدة.
  • منافسة النماذج المغلقة عبر الابتكار المفتوح وتسريع التطوير المجتمعي.

إطلاق Qwen-Image-2512 يؤكد أن Alibaba لا تنافس فقط في النماذج اللغوية، بل تضع نفسها لاعبًا رئيسيًا في مستقبل توليد الصور المفتوح عالي الواقعية.

مقالات مشابهة