ستانفورد وإنفيديا تطوّران ذكاء اصطناعي ينتج فيديوهات دقيقة

كشفت ستانفورد وإنفيديا عن تقنية جديدة تُدعى “Test-Time Training” تمكّن الذكاء الاصطناعي من إنتاج فيديوهات رسوم متحركة بدقة عالية واتساق يمتدان لدقيقة واحدة كاملة.

تفاصيل الخبر

في إنجاز جديد بمجال الذكاء الاصطناعي للفيديو، أعلن فريق بحثي مشترك من ستانفورد وإنفيديا عن تقنية مبتكرة تُعرف باسم “Test-Time Training” أو TTT، والتي تتيح للذكاء الاصطناعي إنتاج فيديوهات أطول وأكثر تماسكًا من أي وقت مضى.

  • التقنية تسمح بإنتاج رسوم متحركة تصل مدتها إلى دقيقة كاملة بمشاهد مترابطة.
  • تعتمد على طبقات TTT التي تعمل كذاكرة طويلة الأمد باستخدام الشبكات العصبية.
  • تُمكن النموذج من تذكّر الأحداث والمشاهد السابقة والحفاظ على التناسق.
  • تم اختبار التقنية باستخدام مقاطع من كرتون “توم وجيري” وأظهرت ديناميكية في الحركة وتفاعل الشخصيات.
  • تم تطويرها كإضافة على نماذج الفيديو الحالية دون الحاجة لبنائها من الصفر.

هذه الخطوة تعالج واحدة من التحديات الكبرى في توليد الفيديو باستخدام الذكاء الاصطناعي، وهي استمرارية المشاهد عبر زمن أطول دون انقطاع.

الأهداف المستقبلية

تسعى التقنية الجديدة من ستانفورد وإنفيديا إلى إحداث ثورة في إنتاج الفيديو باستخدام الذكاء الاصطناعي:

  • إنتاج محتوى قصصي طويل بجودة سينمائية متماسكة.
  • دمج التقنية في صناعات مثل الرسوم المتحركة، التعليم المرئي، وألعاب الفيديو.
  • إضافة إمكانيات الصوت والمؤثرات لتجربة أكثر واقعية.
  • تقليل الحاجة إلى التعديل اليدوي في المونتاج النهائي.

تقنية TTT من ستانفورد وإنفيديا تُعد نقلة نوعية في عالم الفيديوهات الذكية، وتفتح الباب أمام مستقبل جديد لسرد القصص المرئية بشكل أكثر احترافية وواقعية.

مقالات مشابهة