Qwen-Image-2512: نموذج Alibaba الجديد يرفع واقعية الصور

كشفت Alibaba عبر فريق Qwen عن نموذج Qwen-Image-2512 لتوليد الصور من النص، مع تحسينات واضحة في الواقعية، ودقة التفاصيل، وجودة عرض النصوص، ما يجعله من أقوى النماذج المفتوحة حاليًا.

تفاصيل الخبر

يمثل Qwen-Image-2512 تحديث ديسمبر لنموذج Qwen-Image الأساسي، ويعكس قفزة تقنية ملحوظة مقارنة بالإصدار الذي أُطلق في أغسطس، سواء على مستوى الجودة البصرية أو القدرة على تنفيذ التعليمات المعقدة.

النموذج مخصص لمهام Text-to-Image، وهو مفتوح المصدر بترخيص Apache-2.0.
يقدّم واقعية أعلى للبشر، مع تقليل واضح لما يُعرف بـ “الطابع الاصطناعي” في الوجوه وتفاصيل البشرة والشعر.
يعرض تفاصيل طبيعية أدق في المناظر الطبيعية، المياه، النباتات، وفراء الحيوانات.
شهد تحسنًا كبيرًا في عرض النصوص داخل الصور، من حيث الدقة، التخطيط، والدمج بين النص والعناصر البصرية.
أظهرت اختبارات AI Arena، بعد أكثر من 10,000 جولة تقييم أعمى، أن Qwen-Image-2512 يُعد أقوى نموذج مفتوح المصدر حاليًا، مع قدرة تنافسية حتى أمام نماذج مغلقة المصدر.
يدعم الإنجليزية والصينية، ويتكامل بسهولة مع مكتبة Diffusers من Hugging Face، ما يجعله عمليًا للمطورين والباحثين.