Tencent تطلق نموذج HunyuanVideo-Avatar لتحويل الصور إلى فيديوهات واقعية

كشفت Tencent عن نموذجها المفتوح المصدر الجديد HunyuanVideo-Avatar الذي يحوّل الصور الثابتة إلى فيديوهات ناطقة باستخدام الذكاء الاصطناعي.

تفاصيل النموذج الجديد HunyuanVideo-Avatar

في خطوة رائدة في مجال الفيديو التوليدي، أطلقت Tencent Hunyuan بالتعاون مع Tencent Music نموذج HunyuanVideo-Avatar لتحويل الصور الشخصية إلى مقاطع فيديو حيوية مدعومة بالصوت.

تحويل فوري: حمّل صورة وصوت (كلام أو غناء) ليتم توليد فيديو تلقائي يعكس السياق والمشاعر.
إدراك المشهد والعاطفة: النموذج قادر على فهم سياق الصورة والصوت لإنتاج حركات واقعية وتعابير منسجمة.
يدعم سيناريوهات متعددة: يشمل أنماطًا متعددة، كائنات مختلفة، وتفاعل بين عدة شخصيات (قريبًا في النسخة مفتوحة المصدر).
تطبيقات متعددة: مثالي لإنشاء محتوى للفيديوهات القصيرة، التجارة الإلكترونية، الإعلانات، وغير ذلك.
متاح الآن: النسخة ذات الشخصية الواحدة مفتوحة المصدر عبر موقع Hunyuan، وتدعم صوتًا حتى 14 ثانية.

روابط مهمة:

الأهداف المستقبلية للنموذج

قبل الانتقال إلى التوسّع الأكبر، تضع Tencent أهدافًا واضحة لتطوير HunyuanVideo-Avatar:

فتح الوضع متعدد الشخصيات قريبًا للمجتمع البحثي والمطورين.
تمكين منشئي المحتوى والتسويق من توليد مقاطع عالية الجودة دون الحاجة لممثلين أو استوديوهات.
دمج الذكاء العاطفي والسياقي لتحسين دقة التفاعل البصري واللفظي.
تعزيز التكامل مع تطبيقات Tencent Music لدعم فيديوهات الغناء الديناميكي والمؤثر.

بإطلاق HunyuanVideo-Avatar، تضع Tencent معيارًا جديدًا في تحويل الصور إلى فيديوهات واقعية مدعومة بالصوت، مما يفتح آفاقًا هائلة لمستقبل المحتوى التوليدي والتسويق الذكي.