Gemini Omni ثورة جديدة في عالم الذكاء الاصطناعي من جوجل.. متاحة لـ الوطن العربي (تفاصيل)
تحديث Gemini Omni: بعد النجاح الاستثنائي الذي حققه نموذج Gemini في مجال توليد الصور وتعديلها عبر أداة Nano Banana، ومساعدته لملايين المستخدمين في إحياء صورهم القديمة وتجسيد أفكارهم، خطت شركة جوجل خطوة عملاقة نحو المستقبل. أعلنت الشركة رسمياً عن إطلاق تحديث Gemini Omni الجديد، وهو النموذج المتطور الذي يدمج بين قدرات الاستدلال الفائق والابتكار متعدد الوسائط (Multimodal).
من خلال نموذج Gemini Omni، لن تقتصر مدخلاتك على النصوص فقط، بل يمكنك الآن دمج الصور، المقاطع الصوتية، والفيديوهات ضمن طلبك (Prompt) لإنشاء وتعديل فيديوهات عالية الجودة تعتمد على فهم الذكاء الاصطناعي للعالم الحقيقي.

تحديث Gemini Omni: إطلاق نموذج Gemini Omni Flash للجمهور
بدأت جوجل بالفعل في طرح Gemini Omni Flash، وهو النسخة الأولى والأسيرع ضمن عائلة أومني الجديدة. هذا النموذج متاح الآن عبر تطبيق Gemini، ومنصة Google Flow، بالإضافة إلى صناع المحتوى على YouTube Shorts. وتؤكد الشركة أنها ستتيح ميزات إضافية لإنشاء الوسائط المتعددة (كالصور والمقاطع الصوتية المتطورة) خلال الأشهر القليلة القادمة.

أبرز مميزات جميني أومني (Gemini Omni) في صناعة المحتوى
يأتي تحديث Gemini Omni ليعيد تعريف طريقة التعامل مع المحتوى المرئي، وتتلخص أبرز قدراته في النقاط التالية:

1. تعديل الفيديو بالذكاء الاصطناعي عبر المحادثة
يتيح لك أومني تعديل مقاطع الفيديو بسهولة تامة باستخدام اللغة الطبيعية (أوامر نصية بسيطة). الميزانية الأقوى هنا هي أن النظام يستند إلى السياق؛ حيث يفهم كل طلب بناءً على الأمر الذي قبله، مما يضمن:

-
اتساق الشخصيات: بقاء ملامح وملابس الشخصيات ثابتة طوال الفيديو.
-
حركة واقعية: الحفاظ على منطقية الحركة وتسلسل المشاهد دون تشويه بصري.
-
تبديل الخلفيات: إمكانية تغيير البيئة المحيطة أو المشهد بالكامل بلمحة عين.
-
إعادة تخيل الأحداث: رفع فيديو شخصي والطلب من الذكاء الاصطناعي إضافة شخصيات جديدة أو تحويل اللحظة العادية إلى مشهد درامي غير متوقع.
2. فهم قوانين الفيزياء والواقعية الفائقة
لا يقوم Gemini Omni بمجرد دمج صور عشوائية، بل يحلل القوانين الفيزيائية والسياق الثقافي لبناء لقطات تبدو حقيقية تماماً:

-
حركة فيزيائية دقيقة: إدراك متطور لقوى الجاذبية، الطاقة الحركية، وديناميكيات السوائل (مثل حركة تدحرج الكرات أو تدفق المياه).
-
ربط المعرفة بالإبداع: دمج التاريخ والعلوم لإنتاج فيديوهات ذات مغزى وسرد قصصي عميق، بدلاً من مطابقة الأنماط البصرية التقليدية.
إنشاء الفيديوهات من طلبات متعددة الوسائط (Multimodal)
يمكن للمستخدمين الآن تقديم مراجع متنوعة للنظام لإنتاج فيديو متناسق، حيث يدعم التطوير الجديد:

-
تعدد المدخلات: دمج (نص + صورة + فيديو + صوت) في أمر واحد.
-
تحديد الهوية البصرية: يمكنك رفع رسمة يدوية أو صورة شخصية كـ “نقطة بداية” ليقوم الذكاء الاصطناعي ببناء الفيديو بأكمله بناءً على روح هذا المرجع.
-
التحكم في الطابع والحركة: وصف التأثيرات المطلوبة باللغة الطبيعية ليقوم أومني بدمجها بسلاسة.

ملاحظة هامة: يدعم النظام حالياً رفع الأصوات الكلامية البشرية كمراجع صوتية، على أن يتم دعم المؤثرات الصوتية والموسيقى قريباً.

ميزة الأفاتار الرقمي الخاص واستنساخ الصوت
تدرك جوجل أن التعديل الاحترافي يتطلب تحكماً كاملاً بالصوت؛ لذلك تتيح المنصة ميزة تجريبية آمنة ومسؤولة تمكنك من إنشاء نسخة رقمية (Avatar) خاصة بك. يمثل الأفاتار صورتك وصوتك الحقيقي بدقة عالية، مما يتيح لك صناعة محتوى يتحدث نيابة عنك ويبدو كأنه واقعي تماماً.

الأمان والشفافية: تقنية SynthID لتوثيق المحتوى
لمكافحة التزييف العميق وتعزيز مصداقية الويب، تحتوي جميع الفيديوهات المصنوعة بواسطة تحديث Gemini Omni على علامة مائية رقمية غير مرئية تُعرف باسم SynthID. تتيح هذه التقنية للمستخدمين التحقق من أصليّة الفيديو عبر أدوات “بحث Google” ومتصفح Chrome بكل سهولة.
كيفية تجربة وتنزيل Gemini Omni الآن؟
إذا كنت ترغب في بدء استخدام هذه التقنية الثورية، فقد أتاحتها جوجل على النحو التالي:
-
للمشتركين في الخطط المدفوعة: يتوفر نموذج Gemini Omni Flash فوراً لجميع المشتركين في باقات
Google AI ProوGoogle AI Ultra. -
للمستخدمين مجاناً: تم إطلاق الميزة مجاناً لصناع المحتوى عبر تطبيقي YouTube Shorts و YouTube Create لمساعدتهم على إنتاج مقاطع ريلز وفيديوهات قصيرة احترافية في ثوانٍ معدودة.
