Helios من بايت دانس مفتوح الأوزان لتوليد فيديو بالذكاء

أعلنت شركة بايت دانس عن إطلاق نموذج ذكاء اصطناعي باسم Helios بتكوين 14 مليار معلمة قادر على توليد فيديوهات تصل إلى دقيقة بسرعة تقارب الزمن الحقيقي، مع إتاحة الشيفرة والأوزان للعامة.

تفاصيل الخبر

يعتبر Helios نموذجًا جديدًا مفتوح المصدر لتوليد الفيديو باستخدام الذكاء الاصطناعي، ويتميز بعدة جوانب تقنية متقدمة:

  • النموذج يحتوي على 14 مليار معلمة، وهو الأول من نوعه بهذا الحجم يصل إلى سرعة 19.5 إطارًا في الثانية على GPU واحد من نوع NVIDIA H100.
  • يدعم توليد فيديوهات بمقياس دقيقة واحدة تقريبًا بجودة عالية دون الاعتماد على تقنيات التسريع التقليدية مثل KV-cache أو التكميم.
  • الشيفرة البرمجية وأوزان النموذج منشورة للجمهور على GitHub و Hugging Face تحت ترخيص مفتوح، ما يسمح بالتطوير والتعديل.
  • النموذج يعتمد على بنية autoregressive diffusion موحدة تدعم مهام مثل تحويل النص إلى فيديو (T2V) والصورة إلى فيديو (I2V) والفيديو إلى فيديو (V2V).
  • يقاوم مشكلة “الانجراف” في الفيديوهات الطويلة عبر استراتيجيات تدريب جديدة تقلل من الأخطاء التراكمية وتحافظ على الاتساق البصري.
  • Helios يتفوق على نماذج أصغر من حيث السرعة والجودة، ويحقق أداءً مشابهًا لأفضل النماذج الكبيرة في توليد الفيديوهات القصيرة والطويلة.

الأهداف المستقبلية

تسعى بايت دانس من خلال Helios إلى دفع حدود إمكانات الذكاء الاصطناعي في الفيديو عبر:

  • تمكين المطورين والباحثين من استكشاف وتوسيع قدرات النموذج بفضل إتاحته مفتوحة الأوزان والشيفرة.
  • تسريع بحوث وتطبيقات الفيديو الواقعي الطويل الذي يمكن استخدامه في الإنتاج الإبداعي، التعليمي، والإعلاني.
  • تحسين تقنيات التوليد الفوري للفيديو بحيث تصبح أسرع وأكثر كفاءة دون التضحية بالجودة.
  • توسيع دعم المهام المختلفة في النموذج مثل تحويل الصور إلى فيديو والفيديو إلى فيديو بطريقة سلسة.

يمثل إطلاق Helios خطوة مهمة في تقدم نماذج الفيديو القائمة على الذكاء الاصطناعي، حيث يقدم مزيجًا من سرعة التوليد، جودة المحتوى، وإتاحة الموارد مفتوحة المصدر لدفع الابتكار في هذا المجال.

مقالات مشابهة