جوجل تكشف Gemini Omni: نموذج جديد لصناعة الفيديو من أي مدخل

أعلنت شركة عن نموذجها الجديد Gemini Omni خلال حدث Google I/O 2026، وهو نموذج ذكاء اصطناعي قادر على إنشاء وتعديل الفيديوهات من أي نوع من المدخلات مثل النصوص والصور والصوت والفيديو.

تفاصيل الخبر

يمثل Gemini Omni خطوة متقدمة في عالم النماذج متعددة الوسائط، حيث يجمع بين الفهم العميق والقدرة الإبداعية لتوليد محتوى فيديو واقعي وتفاعلي.

  • يمكن للنموذج إنشاء فيديوهات من النصوص أو الصور أو الصوت أو الفيديو كمدخلات مباشرة.
  • يدعم تعديل الفيديوهات عبر الأوامر النصية بطريقة تفاعلية تشبه الحوار.
  • يحافظ على اتساق الشخصيات والمشاهد عبر التعديلات المتتالية داخل نفس الفيديو.
  • يفهم مفاهيم مثل الفيزياء والحركة والضوء لإنتاج مشاهد أكثر واقعية.
  • يمكنه تحويل الفيديوهات إلى تجارب بصرية جديدة بالكامل مع الحفاظ على عناصر القصة الأساسية.
  • يدعم دمج عدة مصادر مثل الصور والموسيقى والفيديو في مخرجات واحدة متكاملة.
  • يستخدم في إنشاء محتوى تعليمي، ترفيهي، وشرح مفاهيم معقدة بطريقة مرئية.
  • يتيح بناء فيديوهات تعتمد على فهم سياقي وليس فقط مطابقة أوامر بسيطة.
  • تم إطلاق النسخة الأولى Gemini Omni Flash عبر تطبيق Gemini وYouTube Shorts وGoogle Flow.

الأهداف المستقبلية

تسعى Google إلى تحويل Gemini Omni إلى منصة رئيسية لإنتاج الفيديوهات الرقمية في المستقبل.

  • تمكين إنشاء الفيديو بالكامل من أي فكرة أو مدخل بسيط.
  • تقليل الحاجة إلى أدوات مونتاج وتقنيات إنتاج معقدة.
  • دمج الذكاء الاصطناعي في صناعة المحتوى التعليمي والإبداعي.
  • دعم إنشاء محتوى مخصص بسرعة عالية للمبدعين والشركات.
  • تطوير نظام متعدد الوسائط يجمع بين النص والصوت والصورة والفيديو في بيئة واحدة.

يمثل Gemini Omni نقلة نوعية في مجال توليد الفيديو بالذكاء الاصطناعي، حيث يفتح الباب أمام جيل جديد من المحتوى التفاعلي الذي يمكن إنشاؤه وتعديله بالكامل عبر الأوامر الطبيعية.

مقالات مشابهة