
أعلنت Google رسميًا عن نموذجها الجديد “Gemini Omni” خلال فعاليات مؤتمر Google I/O 2026، في خطوة تمثل نقلة كبيرة في عالم الذكاء الاصطناعي التوليدي وصناعة المحتوى الرقمي، إذ تصفه الشركة بأنه نموذج قادر على “إنشاء أي شيء انطلاقًا من أي نوع من المدخلات”.
ويأتي النموذج الجديد بقدرات متطورة تسمح بإنشاء مقاطع فيديو احترافية اعتمادًا على النصوص والصور والصوت وحتى الفيديوهات الأصلية، مع دعم كامل للتفاعل والتعديل عبر المحادثة الطبيعية.
إطلاق Gemini Omni Flash لمستخدمي Gemini ويوتيوب Shorts
أكدت جوجل أن الإصدار الأول من النموذج، والذي يحمل اسم “Gemini Omni Flash”، أصبح متاحًا ابتداءً من اليوم داخل تطبيق Gemini، بالإضافة إلى منصتَي Flow وYouTube عبر خدمة Shorts، وذلك لمشتركي باقات Google AI Plus وPro وUltra حول العالم.
ويهدف النموذج الجديد إلى تقديم تجربة أكثر تكاملًا مقارنةً بالأدوات السابقة التي أطلقتها جوجل، مثل Nano Banana ونموذج توليد الفيديو Veo 3.1.
Gemini Omni يدمج النص والصوت والصور والفيديو في طلب واحد
يتميز Gemini Omni بقدرته على معالجة أنواع متعددة من المدخلات في الوقت نفسه، إذ يمكن للمستخدم إدخال نصوص وصور ومقاطع صوتية وفيديوهات ضمن طلب واحد، ليقوم الذكاء الاصطناعي بإنتاج فيديو متكامل عالي الجودة يعتمد على فهم Gemini للعالم الحقيقي.
وعلى عكس نموذج Veo 3.1 الذي ركّز بصورة أساسية على الأوامر النصية والصور، يمنح Gemini Omni المستخدم حرية أكبر في صناعة المحتوى، مع إمكانية تعديل المشاهد بطريقة تفاعلية عبر محادثة مستمرة تحافظ على اتساق الشخصيات والعناصر داخل الفيديو.
تعديل الفيديوهات بالمحادثة الطبيعية
وأوضحت جوجل أن المستخدم يستطيع تصوير فيديو عادي ثم الطلب من Gemini Omni إجراء تغييرات متقدمة داخله، مثل:
- إضافة شخصيات جديدة
- تعديل البيئة والخلفيات
- تغيير زوايا التصوير
- تحسين الأسلوب البصري
- تعديل تفاصيل المشهد بدقة عالية
كما يحافظ النموذج على استمرارية العناصر البصرية أثناء تنفيذ التعليمات المتتابعة، وهو ما يُعد من أبرز التحديات التي تواجه أدوات توليد الفيديو بالذكاء الاصطناعي حاليًا.
فهم أفضل للفيزياء والواقعية داخل الفيديوهات
وأكدت جوجل أن Gemini Omni يمتلك فهمًا متقدمًا للعوامل الفيزيائية، مثل:
- الجاذبية
- الطاقة الحركية
- ديناميكيات السوائل
- حركة العناصر داخل المشاهد
وتقول الشركة إن هذه القدرات ستمنح الفيديوهات الناتجة مظهرًا أكثر واقعية وطبيعية مقارنةً بمعظم نماذج الذكاء الاصطناعي الحالية.
كما يعتمد النظام على قاعدة معرفة واسعة تشمل التاريخ والعلوم والسياقات الثقافية، مما يساعد على إنتاج محتوى مترابط وأكثر دقة.
مخاوف الخصوصية والتزييف العميق
ومن أبرز المزايا التي أثارت الجدل، قدرة Gemini Omni على إنشاء شخصية رقمية تحاكي المستخدم بصوته وشكله اعتمادًا على الصور والعينات الصوتية، وهو ما يفتح الباب أمام مخاوف تتعلق بالخصوصية وتقنيات التزييف العميق (Deepfake).
وفي هذا السياق، أكدت جوجل أنها تطبق سياسات واضحة للحد من إساءة استخدام أدوات الذكاء الاصطناعي، مشيرةً إلى أنها ما زالت تختبر تقنيات تعديل الصوت والكلام قبل طرحها بصورة موسعة.
جوجل تعتمد العلامة المائية SynthID
وأشارت الشركة إلى أن جميع الفيديوهات المُنشأة عبر Gemini Omni ستحمل العلامة المائية الرقمية SynthID الخاصة بجوجل، بهدف تسهيل التحقق من المحتوى المُنتج باستخدام الذكاء الاصطناعي والحد من التضليل الرقمي.
هل ينجح Gemini Omni في حل مشكلات الفيديوهات المولدة بالذكاء الاصطناعي؟
ورغم التطور الكبير الذي تعِد به جوجل، ما تزال جودة الفيديوهات المولدة بالذكاء الاصطناعي تواجه انتقادات بسبب ظهور بعض المشاهد بطريقة غير طبيعية أو غير واقعية.
ومع بدء توفر Gemini Omni للمستخدمين هذا الأسبوع، يبقى الأداء الحقيقي للنموذج ومدى نجاحه في تجاوز هذه المشكلات تحت الاختبار، خاصةً مع المنافسة القوية في سوق أدوات الذكاء الاصطناعي التوليدي.
