Tencent تُطلق Hunyuan World 1.1: لبناء عوالم ثلاثية الأبعاد

أعلنت شركة Tencent عن إطلاق النسخة المفتوحة المصدر من نموذجها Hunyuan World 1.1، القادر على إنشاء عوالم ثلاثية الأبعاد كاملة انطلاقًا من مقاطع الفيديو أو مجموعة من الصور خلال ثوانٍ فقط، باستخدام وحدة معالجة رسومات واحدة (GPU).

تفاصيل الخبر

يمثل Hunyuan World 1.1 نقلة نوعية في مجال إعادة بناء المشاهد ثلاثية الأبعاد باستخدام الذكاء الاصطناعي، إذ يعتمد على بنية Transformer موحدة تتيح معالجة مدخلات متعددة مثل الصور، وخرائط العمق، ومواضع الكاميرات، لإنتاج نماذج هندسية عالية الدقة بسرعة كبيرة.

إعادة بناء فورية: النموذج ينشئ عالمًا ثلاثي الأبعاد كاملاً خلال ثوانٍ، دون الحاجة لأي تحسين خاص بالمشهد.
مدخلات متعددة: يدعم استخدام الفيديوهات أو الصور المتعددة كمصدر لإنشاء النماذج.
جودة هندسية عالية: يُولّد تمثيلات متنوعة مثل السحب النقطية، وخرائط العمق، والمعالم السطحية، والمعلمات الكاميرية.
مرونة في العمل: يمكنه دمج معلومات أولية مثل موقع الكاميرا أو عمق المشهد لتحسين الدقة.
مقارنة الأداء: تفوّق على نماذج أخرى مثل MapAnything وVGGT وπ³ في إعادة بناء المشاهد الواقعية والأنماط المختلفة للفيديوهات المنتجة بالذكاء الاصطناعي.
كود مفتوح المصدر: النموذج متاح على GitHub وHugging Face، كما نُشرت ورقته البحثية على arXiv تحت عنوان WorldMirror: Universal 3D World Reconstruction with Any-Prior Prompting.

الأهداف المستقبلية

تسعى Tencent من خلال Hunyuan World إلى:

تعزيز دقة إعادة بناء العوالم الافتراضية من مقاطع الفيديو في الزمن الحقيقي.
توسيع دعم النموذج ليشمل تطبيقات الألعاب، الواقع المعزز، والروبوتات.
تمكين المطورين من بناء بيئات تفاعلية ثلاثية الأبعاد بأقل كلفة حوسبية.
دمج النموذج في نظام Hunyuan AI الأشمل لتطوير أدوات إنتاج مرئي ذكية.

يؤكد إطلاق Hunyuan World 1.1 التزام Tencent بتطوير تقنيات ثلاثية الأبعاد قائمة على الذكاء الاصطناعي، مما يفتح الباب أمام عصر جديد من إنشاء العوالم الافتراضية بسرعة ودقة غير مسبوقتين.