Wan 2.1‑FLF2V‑14B: نموذج مفتوح المصدر للفيديو من Alibaba

أطلقت Alibaba نموذج Wan 2.1‑FLF2V‑14B مفتوح المصدر لتوليد فيديو مدته 5 ثوانٍ بدقة 720p، يعتمد على صورتين فقط—الإطار الأول والأخير—متاح مجانًا على GitHub وHugging Face.

تفاصيل الخبر

أعلنت Alibaba عن توفير نموذج Wan 2.1‑FLF2V‑14B على مستودعات الأكواد المفتوحة، بعد إطلاقه في يناير 2025 تحت اسم Wan2.1 ثم إعادة تسميته، ضمن منافستها الحادة في سوق موديلات الفيديو التوليدية.

النقاط الرئيسية في قدرات النموذج:

  • التحكم بالإطارين: يولد فيديو من صورتين تمثلان البداية والنهاية، ما يوفر تحكمًا دقيقًا في المحتوى الزمني.
  • مدة الفيديو ودقته: ينتج مشهدًا متحركًا مدته خمس ثوانٍ وبدقة 720p، مع انتقالات سلسة وتماسك بصري عالٍ.
  • تقنيات أساسية:
    • CLIP لاستخلاص السمات الدلالية من الإطارين والتحكم في المحتوى.
    • Diffusion Transformer (DiT) مع حقن متقاطع للانتباه يضمن ثبات الصورة وتماسك المشاهد عبر الزمن.
  • بيانات التدريب: تدرب على 150 مليون فيديو و1 مليار صورة لتعلّم الحركات الدقيقة وقوانين الفيزياء الواقعية.
  • الدعم اللغوي: يُنصح باستخدام المُحفزات الصينية لتحقيق أفضل النتائج، مع دعم تشغيلي قوي للسيناريوهات متعددة اللغات.
  • التوافر: الأوزان والشفرة المصدرية متاحة عبر GitHub، مع واجهة جاهزة للاستخدام على Hugging Face بمختلف الصيغ مثل packed 1.58‑bit وGGUF.
  • إنتاجية عالية: مقارنة بالنماذج التقليدية، يقدم النموذج حلاً فعالًا يقلل من التكلفة الحسابية ويحدّ من مشاكل الاهتزاز وانحراف المحتوى.
  • مجالات التطبيق: صياغة مقاطع دعائية وسينمائية، توليد مشاهد ألعاب تفاعلية، دعم الأبحاث التعليمية، وتمكين المستخدمين العاديين من صناعة محتوى قصير مخصص.

الأهداف المستقبلية

من خلال Wan 2.1‑FLF2V‑14B، تضع Alibaba أولوياتها التالية:

  • توسيع زمن ودقة الفيديو لدعم مشاهد أطول وجودة أعلى.
  • تحسين كفاءة التشغيل على الأجهزة الطرفية عبر تسريعات برمجية وهندسية.
  • دمج الواجهة المرئية في أدوات إبداعية مثل Gradio وComfyUI لتسهيل الاستخدام.
  • تطوير دعم لغات إضافية وتدريب النموذج على سيناريوهات ثقافية متنوعة.
  • تشجيع المجتمع على المساهمة والتوسع في ميزات التحكم والإخراج عبر فتح شراكات بحثية وصناعية.

يمثل إطلاق Wan 2.1‑FLF2V‑14B علامة فارقة في مجال توليد الفيديو بالذكاء الاصطناعي من صورتين فقط، مؤكدًا ريادة Alibaba في بناء نماذج مفتوحة المصدر تجمع بين الدقة والتكلفة المنخفضة وكفاءة التشغيل.

مقالات مشابهة