يضع Omni Studio Gemini Omni بين أيديكم، نموذج Google DeepMind متعدد الوسائط. أدخلوا نصًّا، أو حتى خمس صور، أو مرجعًا صوتيًّا، أو مقطعًا. سيعود إليكم فيديو بصوت طبيعي وعلامة مائية. ثم تُحسّنونه بالحوار معه.
لا حاجة للتسجيل لرؤية أول معالجة.
ينسجم Omni مع سير عملكم، لا العكس.
صورة واحدة تكفي للحصول على مقطع جذّاب من عشر ثوانٍ. بلا أي جدول زمني.
لقطات منتج بنصّ مدمج داخل الكادر، يُدار كلّه عبر الحوار.
شروحات بأسلوب الكلاي ميشن، تصوّرات علمية، وفقرات تاريخية.
لوحات مفاهيم، ريلات تقديم، وتنويعات بتقنية نقل الأسلوب، دفعةً واحدة.
اضغطوا على أي بطاقة لإعادة مزجها.
كلّ هذه الوسائط يمكنها أن تتعايش داخل موجّه واحد.
صفوا اللقطة. اتّكئوا على ما يعرفه النموذج مسبقًا.
/place a quiet forest clearing /light golden hour, warm /action a small fox approaches the camera, curious
حتى خمس صور لتوجيه النتيجة.
مقطع صوتي واحد. لاستخدام صوتكم الخاصّ، سجّلوا تسلسلًا قصيرًا من الأرقام لتأكيد هويّته.
أعيدوا مزج مقطع قائم. غيّروا الأسلوب، استبدلوا العناصر، انقلوا الحركة.
الموجّه السداسي المحاور هو ما يصنع الفارق. نُعرّف التأطير والضوء والفعل، ثم نُكرّر العمل على ما يظهر بالفعل على الشاشة. خفض وقت لوحات المفاهيم بنسبة 80%.
رسم النصّ داخل الكادر هو ما حسم القرار بالنسبة لي. لقطة منتج رئيسية برمز SKU مرسوم داخل الإطار، بلا مرور بـ After Effects. ثلاثة أسابيع من عمل وكالة، أنجزتها في ظهيرة واحدة.
أُدرّس الفيزياء في الثانوية. الشروحات بالستوب موشن كانت تستغرق أسبوعًا. مع Omni أوجّه الرسم البياني مرّة، ثم أُحسّنه في الدردشة، ثم أنشره ضمن الحصّة نفسها.
التحرير بالحوار يتفوّق على العبث بالإعدادات. "اجعل الإضاءة أدفأ" يعمل مباشرة، والشخصية تبقى الشخص نفسه من لقطة إلى أخرى.
الصوت الطبيعي هو ما أقنعني. صوت متزامن مع حركة الشفاه، ضجيج الغرفة، فولي، كلّها في مرور واحد. أنقذ ميزانية ما بعد الإنتاج لديّ مرّتين هذا الشهر.
أيّ مرجع، حتى خمسة معًا. أسلوب من ملصق، حركة من مقطع، صوت من ملف wav. لا يُقاومكم Omni، بل يُنفّذ.
أول نموذج في عائلة Omni من DeepMind.
من الموجّه إلى المقطع إلى التحرير، على شاشة واحدة.
دليل الموجّهات صار حقولًا منظّمة.
Median 23 seconds. Live status & cost.
التحسينات الحوارية تُحافظ على ثبات المشهد.
كلّ قدرة هنا هي شيء يُنتجه النموذج بثبات، لا حالة استعراض منتقاة.
نصّ يمكن قراءته فعلاً. ثلثيات، ملصقات، تسلسلات أبجدية، علامات تجارية مدمجة في اللقطة.
ولّدوا أوّلًا، ثم كرّروا التحسين بالحوار. يظلّ المشهد ثابتًا عبر كلّ تحسين.
صورة، فيديو، صوت، رسم. اجمعوا حتى خمسة مدخلات في موجّه واحد.
دولي، اقتراب، لقطة مستمرّة، فوق الكتف. تصفون باللغة الطبيعية، فيُنفّذ النموذج بدقّة.
صوت ديجيتي، طبقات بيئية، صوت متزامن مع الشفاه. بلا مرور صوتي منفصل.
من الكلاي ميشن إلى فنّ الفوكسل، وصولاً إلى الهولوغرام. الحركة تثبت، يتغيّر السطح وحده.
الكرات تتدحرج، القماش يستقرّ، الماء ينعكس. والتفاعلات المتسلسلة تتسلسل فعلاً.
الشخص نفسه من لقطة إلى أخرى، عبر البيئات وحتى مع تبديل الأساليب. الوجوه والملابس تبقى على حالها.
مصدر يمكنكم التحقّق منه. تصمد العلامة المائية بعد الضغط والاقتصاص وإعادة الترميز.
قراءة صريحة: أين يتقدّم Omni، وأين يتعادل، وما الذي لا يسعى أصلًا ليكونه.
| هذا نحنOmni Studio | Google · VeoVeo 3.1 | OpenAISora 2 | RunwayGen-4 | |
|---|---|---|---|---|
| النصّ داخل الكادر | رائد فئته. الثلثيات والملصقات والتسلسلات الأبجدية تثبت. | جيّد. التعليقات القصيرة تعمل. | محدود. ينحرف في النصوص الطويلة. | جيّد. نصّ العلامة التجارية مقبول. |
| تحرير متعدد الجولات | دردشة أصلية. المشهد والشخصية يثبتان. | إعادة توجيه يدوية. | إعادة توجيه يدوية. | إعادة توجيه يدوية. |
| صوت طبيعي | صوت + SFX + خلفية بيئية في مرور واحد. | محدود. SFX فقط. | إخراج صامت. | إخراج صامت. |
| مدخلات مرجعية | صورة، فيديو، صوت، رسم. حتى 5 مدمجة. | صورة فقط. | صورة ومقطع قصير. | صورة وفرشاة حركة. |
| مدّة الإخراج | 10 ثوانٍ كقاعدة، قابلة للسلسلة عبر الدردشة. | 8 ثوانٍ. | من 8 إلى 20 ثانية حسب الباقة. | 10 ثوانٍ. |
| المصدر | علامة SynthID مائية، قابلة للتحقّق. | علامة SynthID مائية. | بيانات C2PA الوصفية. | بيانات C2PA الوصفية. |
| الأنسب لـ | المبدعون والمعلّمون وفرق العلامات التجارية الذين يُسلّمون فيديو جاهزًا للنشر. | صنّاع الأفلام الباحثون عن مظهر سينمائي خالص. | محتوى قصير قائم على السرد. | تصميم الحركة وخطوط عمل VFX. |
أسعار Google تُمرّر كما هي، مع رسم ثابت لكلّ مقعد.
حتى 200 دقيقة شهريًّا.
أولوية في الطابور وتحسينات بلا حدود.
مساحة عمل مشتركة للفرق.
إن لم يكن سؤالكم هنا، أرسلوا لنا رسالة.
Gemini Omni هو أوّل نموذج متعدد المدخلات والمخرجات من Google DeepMind، أُعلن عنه في 19 مايو 2026 ضمن مؤتمر I/O. نموذج واحد، تمريرة واحدة: يقرأ النصّ والصور والصوت والفيديو، ويُخرج فيديو بصوت طبيعي. يخلف عائلة Veo ويستوعب قدرات Nano Banana (تحرير الصور) وGenie (العوالم التفاعلية). Omni Studio هو واجهتنا فوقه، دون أي ارتباط مع Google. نمرّر واجهات Gemini وVertex الرسمية (فور توفّرها) بدون أي رسوم إضافية.
At launch, in: text, up to 5 reference images, a voice reference, a video clip, or sketches. Out: 10s clips, 16:9 aspect ratio, 1080p, with native audio. Image and audio outputs are on Google's roadmap and we'll surface them when they land.
دُرِّب Omni على التحرير متعدد الجولات، فيحافظ على ثبات المشهد عبر التحسينات. بعد التوليد، تكتبون أشياء من قبيل "اجعل الإضاءة أدفأ" أو "استبدل الخلفية"، فيُعيد النموذج المعالجة محتفظًا بالشخصيات والحركة ومسار الكاميرا. كلّ تحسين يُصبح عقدة جديدة في شجرة مكتبتكم، يمكنكم التفرّع منها والمقارنة بحريّة.
SynthID هو علامة Google المائية الخفيّة، مدمجة في كلّ مخرج من Omni. غير محسوسة للعين، لكن يمكن التحقّق منها عبر تطبيق Gemini وChrome وبحث Google. تصمد أمام إعادة الترميز والاقتصاص وتسجيل الشاشة. المصدر ليس خيارًا اختياريًّا: كلّ مقطع تُنشئونه هنا يخرج موقّعًا.
تعديل الصوت محدود عند الإطلاق (قرار من Google) حتى يجهز تطبيق أكثر أمانًا. يمكنكم إرسال مرجع صوتي، لكن لاستخدام صوتكم كأفاتار، عليكم أوّلًا تسجيل تسلسل قصير من الأرقام (وسيلة الحماية الرسمية ضدّ التزييف العميق). جميع المخرجات تحمل علامة SynthID المائية، والمنصّة مخصّصة لمن تجاوزوا الثامنة عشرة.
Google said 'in the coming weeks' on May 19. الأسعار isn't public yet. Press projections sit around $0.10-0.30 / sec for video output. We'll pass Google's pricing through with no markup and bill the seat ($20-100/شهر) on top. Join the API waitlist above to get keys the day it goes live.
نعم. الإلغاء يتمّ من الإعدادات مباشرة، بلا بريد إلكتروني وبلا تعقيد. الدقائق غير المستخدمة تنتقل إلى الشهر التالي لمدة 30 يومًا. إن ألغيتم خلال 14 يومًا من الدفع، نُرجع المبلغ كاملًا، بدون أسئلة وبدون نماذج.
الموجّهات والمخرجات تُحفظ على Vercel Blob Storage (المنطقة الافتراضية أوروبا، الولايات المتّحدة كخيار). لا نستخدم إنشاءاتكم لتدريب نماذجنا. تخضع معالجة Google الكامنة لشروط استخدام بيانات واجهة Gemini. خدمة عدم الاحتفاظ بالبيانات (Zero Data Retention) متاحة في باقتي Pro وUltra.
ثلاث عمليات إنشاء على حسابنا. بدون بطاقة بنكية.