Tencent

Tencent تطلق نموذج HunyuanVideo-Avatar لتحويل الصور إلى فيديوهات واقعية

كشفت Tencent عن نموذجها المفتوح المصدر الجديد HunyuanVideo-Avatar الذي يحوّل الصور الثابتة إلى فيديوهات ناطقة باستخدام الذكاء الاصطناعي.

تفاصيل النموذج الجديد HunyuanVideo-Avatar

في خطوة رائدة في مجال الفيديو التوليدي، أطلقت Tencent Hunyuan بالتعاون مع Tencent Music نموذج HunyuanVideo-Avatar لتحويل الصور الشخصية إلى مقاطع فيديو حيوية مدعومة بالصوت.

  • تحويل فوري: حمّل صورة وصوت (كلام أو غناء) ليتم توليد فيديو تلقائي يعكس السياق والمشاعر.
  • إدراك المشهد والعاطفة: النموذج قادر على فهم سياق الصورة والصوت لإنتاج حركات واقعية وتعابير منسجمة.
  • يدعم سيناريوهات متعددة: يشمل أنماطًا متعددة، كائنات مختلفة، وتفاعل بين عدة شخصيات (قريبًا في النسخة مفتوحة المصدر).
  • تطبيقات متعددة: مثالي لإنشاء محتوى للفيديوهات القصيرة، التجارة الإلكترونية، الإعلانات، وغير ذلك.
  • متاح الآن: النسخة ذات الشخصية الواحدة مفتوحة المصدر عبر موقع Hunyuan، وتدعم صوتًا حتى 14 ثانية.

روابط مهمة:

الأهداف المستقبلية للنموذج

قبل الانتقال إلى التوسّع الأكبر، تضع Tencent أهدافًا واضحة لتطوير HunyuanVideo-Avatar:

  • فتح الوضع متعدد الشخصيات قريبًا للمجتمع البحثي والمطورين.
  • تمكين منشئي المحتوى والتسويق من توليد مقاطع عالية الجودة دون الحاجة لممثلين أو استوديوهات.
  • دمج الذكاء العاطفي والسياقي لتحسين دقة التفاعل البصري واللفظي.
  • تعزيز التكامل مع تطبيقات Tencent Music لدعم فيديوهات الغناء الديناميكي والمؤثر.

بإطلاق HunyuanVideo-Avatar، تضع Tencent معيارًا جديدًا في تحويل الصور إلى فيديوهات واقعية مدعومة بالصوت، مما يفتح آفاقًا هائلة لمستقبل المحتوى التوليدي والتسويق الذكي.

مقالات مشابهة