Lightricks تطرح LTX-2 مفتوح المصدر لإنشاء فيديو بدقة 4K

أطلقت شركة Lightricks نموذج LTX-2 للذكاء الاصطناعي مفتوح المصدر، وهو نموذج متعدد الوسائط قادر على توليد فيديو بدقة 4K مع صوت متزامن وتحكم دقيق في الحركة والكاميرا، ما يتيح أدوات إنتاج احترافية للمبدعين والمطورين بدون قيود.

تفاصيل الخبر

LTX-2 يقدم جاهزية إنتاجية حقيقية في إنشاء المحتوى المرئي المدمج بالصوت، مع توفير كل الأوزان والكود وأدوات التدريب في متناول الجميع.

طرح مفتوح المصدر كامل يشمل الأوزان الرئيسية، نسخة مكررة مخفّضة، ومجموعة من LoRA adapters لتخصيص الأسلوب والمهام.
يوفر إطار تدريب Trainer متكامل مع دعم بيانات متعددة الوسائط، إعدادات مرجعية، وتقييم متعدد-GPU.
تم تحسين الأداء عبر تسريع NVIDIA ليعمل بكفاءة على بطاقات GPU استهلاكية مثل RTX 5090 وأنظمة متقدمة مثل DGX-9.
النموذج يولد فيديو يصل إلى 20 ثانية بدقة 4K وسرعة تصل إلى 50 إطارًا في الثانية مع تزامن دقيق للصوت (lip-sync) وصوت بيئي متسق.
دعم التحكم الدقيق في الحركة باستخدام مفاتيح إطار متعددة، منطق الكاميرا ثلاثي الأبعاد، ومدخلات متعددة الوسائط (نص، صورة، فيديو، صوت، عمق).
معمارية فعّالة للغاية تسمح بتشغيل النموذج على GPU مستهلكة دون الحاجة لعِتاد خاص.

الأهداف المستقبلية

من خلال إصدار LTX-2 مفتوح المصدر، تتطلع Lightricks لتحقيق عدة أهداف استراتيجية في مشهد الإبداع الذكي:

جعل نماذج فيديو صوتية متعددة الوسائط متاحة للجميع بدون قيود الأوزان المغلقة.
تمكين المطورين والباحثين والاستوديوهات من تشغيل، تعديل، وتحسين النموذج بحرية تامة.
دعم المجتمع العالمي في بناء LoRAs، أدوات، تكاملات، وواجهات إبداع جديدة.
فتح الباب أمام أفكار وتطبيقات غير متوقعة لم يحددها مطورو النموذج الأصليون بعد.
دفع حدود الإبداع التوليدي الذكي من خلال مشاركة المعرفة والأدوات والنتائج.

طرح LTX-2 كمنصة مفتوحة بالكامل يمثل خطوة كبيرة نحو إتاحة أدوات إنتاج الفيديو والصوت الإبداعي بالذكاء الاصطناعي للجميع، مما يخلق مجتمعًا نشطًا من المبدعين والمطورين لتطوير تطبيقات جديدة غير مسبوقة في عالم الوسائط المتعددة.