Veo 3 من Google: فيديو وصوت من صورة واحدة فقط!

أعلنت Google عن تحديث ثوري لأداة Veo 3 يمكّن المستخدمين من توليد فيديو كامل بالصوت انطلاقًا من صورة واحدة فقط، مما يعزز اتساق الشخصيات وسرد القصص.

تفاصيل الخبر

أطلقت Google تحديثًا جديدًا لأداة Veo 3 ضمن مجموعة Gemini، حيث أصبح بإمكان المستخدمين بدء إنشاء الفيديو من صورة ثابتة واحدة فقط، وإضافة الصوت تلقائيًا، بما في ذلك الحوارات، والمؤثرات الصوتية، والموسيقى التصويرية.

أبرز مزايا التحديث:

  • التحكم في الإطار الأول: يمكّن المخرجين من تثبيت هوية الشخصيات وتكرارها عبر المشاهد.
  • إنشاء الفيديو + الصوت دفعة واحدة: مما يختصر ساعات من العمل على المونتاج والمعالجة.
  • دعم المؤثرات البيئية والحوارات: يمكن للمستخدم كتابة الحوار، الحركة، ونوع المؤثرات ضمن النص التوجيهي.
  • تحسين استمرارية المشاهد: بفضل الدمج بين التكوين البصري والتحكم في الصوتيات.
  • تكامل مع أدوات Google الأخرى: مثل Flow وGemini لإنشاء مشاهد مركبة متعددة الأساليب.

الأهداف المستقبلية

تسعى Google من خلال Veo 3 إلى:

  • تسهيل صناعة الأفلام والقصص المرئية لأي شخص عبر واجهة بسيطة تعتمد على الصور والنصوص فقط.
  • خفض تكاليف الإنتاج بتقليل الحاجة إلى فرق صوت، تصميم، ومونتاج خارجي.
  • تقديم أداة إنتاج متكاملة يمكن استخدامها في الإعلان، التعليم، وصناعة المحتوى.
  • منافسة أدوات كبرى مثل Sora من OpenAI، عبر دمج الفيديو والصوت بسلاسة ضمن تدفق عمل واحد.
  • تطوير نماذج أكثر دقة واستقرارًا خصوصًا في توليد الصوت مع الصورة.

ملاحظات المستخدمين

أبرز ما لاحظة المستخدمين:

  • أبلغ بعض المستخدمين عن مشكلة في تزامن الصوت مع الفيديو عند استخدام وضع “صورة إلى فيديو”.
  • في بعض الحالات، يتم التراجع تلقائيًا إلى Veo 2 للحصول على نتائج أكثر استقرارًا.
  • ينصح باستخدام واجهة Flow للحصول على نتائج أكثر موثوقية في الإخراج والتوليد المتقدم.

Veo 3 تمثل قفزة نوعية في عالم الفيديو بالذكاء الاصطناعي، حيث يكفي أن تبدأ بصورة واحدة لتحصل على مشهد متكامل بالصوت والحوار والحركة. إنها بداية عصر جديد من الإبداع الفوري.

مقالات مشابهة