Tencent تطلق نموذج HunyuanVideo-Avatar لتحويل الصور إلى فيديوهات واقعية
كشفت Tencent عن نموذجها المفتوح المصدر الجديد HunyuanVideo-Avatar الذي يحوّل الصور الثابتة إلى فيديوهات ناطقة باستخدام الذكاء الاصطناعي.

تفاصيل النموذج الجديد HunyuanVideo-Avatar
في خطوة رائدة في مجال الفيديو التوليدي، أطلقت Tencent Hunyuan بالتعاون مع Tencent Music نموذج HunyuanVideo-Avatar لتحويل الصور الشخصية إلى مقاطع فيديو حيوية مدعومة بالصوت.
- تحويل فوري: حمّل صورة وصوت (كلام أو غناء) ليتم توليد فيديو تلقائي يعكس السياق والمشاعر.
- إدراك المشهد والعاطفة: النموذج قادر على فهم سياق الصورة والصوت لإنتاج حركات واقعية وتعابير منسجمة.
- يدعم سيناريوهات متعددة: يشمل أنماطًا متعددة، كائنات مختلفة، وتفاعل بين عدة شخصيات (قريبًا في النسخة مفتوحة المصدر).
- تطبيقات متعددة: مثالي لإنشاء محتوى للفيديوهات القصيرة، التجارة الإلكترونية، الإعلانات، وغير ذلك.
- متاح الآن: النسخة ذات الشخصية الواحدة مفتوحة المصدر عبر موقع Hunyuan، وتدعم صوتًا حتى 14 ثانية.
روابط مهمة:
الأهداف المستقبلية للنموذج
قبل الانتقال إلى التوسّع الأكبر، تضع Tencent أهدافًا واضحة لتطوير HunyuanVideo-Avatar:
- فتح الوضع متعدد الشخصيات قريبًا للمجتمع البحثي والمطورين.
- تمكين منشئي المحتوى والتسويق من توليد مقاطع عالية الجودة دون الحاجة لممثلين أو استوديوهات.
- دمج الذكاء العاطفي والسياقي لتحسين دقة التفاعل البصري واللفظي.
- تعزيز التكامل مع تطبيقات Tencent Music لدعم فيديوهات الغناء الديناميكي والمؤثر.
بإطلاق HunyuanVideo-Avatar، تضع Tencent معيارًا جديدًا في تحويل الصور إلى فيديوهات واقعية مدعومة بالصوت، مما يفتح آفاقًا هائلة لمستقبل المحتوى التوليدي والتسويق الذكي.