أنشئوا فيديوهات من نصّ مع Gemini Omni

Q: ما الذي يمكن إدخاله، وما الذي يخرج؟

عند الإطلاق، المدخلات: نصّ، حتى 5 صور مرجعية، مرجع صوتي، مقطع فيديو، أو رسومات. المخرجات: مقاطع 10 ثوانٍ، نسبة 16:9، 1080p، مع صوت طبيعي. إخراج الصور والصوت موجود في خارطة طريق Google، وسنُضيفه فور وصوله.

Q: متى تنطلق واجهة API، وما تسعيرتها؟

قالت Google في 19 مايو "خلال الأسابيع القادمة". الأسعار لم تُعلن بعد. تتوقّع التقديرات الصحفية مدى يتراوح بين 0.10 و0.30 دولار لكلّ ثانية فيديو. سنمرّر أسعار Google بدون رسوم إضافية، ونحتسب رسم المقعد (20 إلى 100 دولار شهريًّا) فوقها. سجّلوا في قائمة انتظار API أعلاه لتحصلوا على مفاتيحكم يوم الإطلاق.

أُنشئ مع Omni · آخر 24 ساعة

جدار من الإبداعات.

اضغطوا على أي بطاقة لإعادة مزجها.

ONER

"When the person touches the mirror, transforms into a detailed monochrome line art drawing"

transform · 0:08via DeepMind

ZOOM

"Make the hand-shaped hole super zoom and magnify the ground it's looking at"

reimagine · 0:10via DeepMind

SOUND

"When the finger touches the animal toy, play the sound the animal makes"

sound · 0:08via DeepMind

CLAY

"Skeuomorphism stop-motion explainer of how the brain hippocampus works"

explainer · 0:18via DeepMind

VOXEL

"When the person touches the mirror, the entire environment turns into 3D voxel art"

transform · 0:08via DeepMind

MUSIC

"The lights of the apartments start turning on in sync with the music"

reimagine · 0:08via DeepMind

TEXT

"26 items, one per alphabet letter. Lower-third labels written on paper. 9 frames per item at 24fps."

text · 0:11via DeepMind

FIELD

"Transport the violinist to the image environment, sun-drenched grassy field"

multi-turn · 0:08via DeepMind

PUPPET

"When the person touches the mirror, transforms into a felted stuffed puppet with googley eyes and glasses"

transform · 0:08via DeepMind

ANGLE

"Change the camera angle to be over the violinist's shoulder"

multi-turn · 0:08via DeepMind

HOLO

"When the person touches the mirror, transforms into a vintage monochrome 3D line-art hologram inside a holodeck"

transform · 0:08via DeepMind

TEXT

"Word by word, one at a time. Each word appears with a different animated style, in rhythm with the audio."

text · 0:09via DeepMind

اكتشفوا المعرض الكامل →

متعدد الوسائط في المدخلات

أحضِروا ما لديكم. وامزجوه كما تشاؤون.

كلّ هذه الوسائط يمكنها أن تتعايش داخل موجّه واحد.

01 · نصّ

لغة طبيعية

صفوا اللقطة. اتّكئوا على ما يعرفه النموذج مسبقًا.

/place  a quiet forest clearing
/light  golden hour, warm
/action a small fox approaches the camera, curious

02 · صور × 5

صور مرجعية

حتى خمس صور لتوجيه النتيجة.

03 · صوت

مرجع صوتي

مقطع صوتي واحد. لاستخدام صوتكم الخاصّ، سجّلوا تسلسلًا قصيرًا من الأرقام لتأكيد هويّته.

04 · فيديو

مقطع فيديو

أعيدوا مزج مقطع قائم. غيّروا الأسلوب، استبدلوا العناصر، انقلوا الحركة.

ما يقوله المختبرون الأوائل

ست شهادات مبكّرة. وخيط واحد يجمعها.

الموجّه السداسي المحاور هو ما يصنع الفارق. نُعرّف التأطير والضوء والفعل، ثم نُكرّر العمل على ما يظهر بالفعل على الشاشة. خفض وقت لوحات المفاهيم بنسبة 80%.

Mira Tessier

مديرة إبداعية · Foxglove Studio

رسم النصّ داخل الكادر هو ما حسم القرار بالنسبة لي. لقطة منتج رئيسية برمز SKU مرسوم داخل الإطار، بلا مرور بـ After Effects. ثلاثة أسابيع من عمل وكالة، أنجزتها في ظهيرة واحدة.

Rachel Kim

قائد علامة تجارية · Northwind

أُدرّس الفيزياء في الثانوية. الشروحات بالستوب موشن كانت تستغرق أسبوعًا. مع Omni أوجّه الرسم البياني مرّة، ثم أُحسّنه في الدردشة، ثم أنشره ضمن الحصّة نفسها.

Liam Patel

Educator · Klein & Co Academy

التحرير بالحوار يتفوّق على العبث بالإعدادات. "اجعل الإضاءة أدفأ" يعمل مباشرة، والشخصية تبقى الشخص نفسه من لقطة إلى أخرى.

Sofia Garcia

صانعة محتوى على YouTube · 480 ألف مشترك

الصوت الطبيعي هو ما أقنعني. صوت متزامن مع حركة الشفاه، ضجيج الغرفة، فولي، كلّها في مرور واحد. أنقذ ميزانية ما بعد الإنتاج لديّ مرّتين هذا الشهر.

Ethan Brooks

صانع أفلام مستقل · Lumen Labs

أيّ مرجع، حتى خمسة معًا. أسلوب من ملصق، حركة من مقطع، صوت من ملف wav. لا يُقاومكم Omni، بل يُنفّذ.

Maya Iwasaki

مصمّمة علامات تجارية · Helio

آلية العمل

ثلاث خطوات. استوديو واحد.

من الموجّه إلى المقطع إلى التحرير، على شاشة واحدة.

الخطوة 01

كوّنوا اللقطة عبر ستة محاور

دليل الموجّهات صار حقولًا منظّمة.

/cadrage wide-angle, oner
/style cinematic, grounded
/light warm, golden hour
/place forest clearing
/action fox approaches fire

⌘↵ توليد

الخطوة 02

شاهدوا المعالجة وهي تجري

Median 23 seconds. Live status & cost.

⏱ 0:23 حتى أول إطار

الخطوة 03

حسّنوا اللقطة بالحوار

التحسينات الحوارية تُحافظ على ثبات المشهد.

اجعل الإضاءة أدفأ

✓ تمت إعادة المعالجة

أضف ضبابًا خفيفًا

✓ keeping fox & camera path

⌘B عرض الدردشة

المزايا

ما يفعله Gemini Omni فعلاً.

كلّ قدرة هنا هي شيء يُنتجه النموذج بثبات، لا حالة استعراض منتقاة.

01 · نصّ

رسم النصّ داخل الكادر

نصّ يمكن قراءته فعلاً. ثلثيات، ملصقات، تسلسلات أبجدية، علامات تجارية مدمجة في اللقطة.

02 · دردشة

تحرير متعدد الجولات

ولّدوا أوّلًا، ثم كرّروا التحسين بالحوار. يظلّ المشهد ثابتًا عبر كلّ تحسين.

03 · مدخلات

أيّ مرجع، أيّ صيغة

صورة، فيديو، صوت، رسم. اجمعوا حتى خمسة مدخلات في موجّه واحد.

04 · كاميرا

إخراج الكاميرا

دولي، اقتراب، لقطة مستمرّة، فوق الكتف. تصفون باللغة الطبيعية، فيُنفّذ النموذج بدقّة.

05 · صوت

صوت طبيعي ومؤثرات SFX

صوت ديجيتي، طبقات بيئية، صوت متزامن مع الشفاه. بلا مرور صوتي منفصل.

06 · أسلوب

نقل الأسلوب

من الكلاي ميشن إلى فنّ الفوكسل، وصولاً إلى الهولوغرام. الحركة تثبت، يتغيّر السطح وحده.

07 · حركة

حركة تحترم الفيزياء

الكرات تتدحرج، القماش يستقرّ، الماء ينعكس. والتفاعلات المتسلسلة تتسلسل فعلاً.

08 · شخصيات

ثبات الشخصيات

الشخص نفسه من لقطة إلى أخرى، عبر البيئات وحتى مع تبديل الأساليب. الوجوه والملابس تبقى على حالها.

09 · مصدر

علامة SynthID المائية

مصدر يمكنكم التحقّق منه. تصمد العلامة المائية بعد الضغط والاقتصاص وإعادة الترميز.

Omni أمام الآخرين

Gemini Omni في مواجهة البقية.

قراءة صريحة: أين يتقدّم Omni، وأين يتعادل، وما الذي لا يسعى أصلًا ليكونه.

	هذا نحنOmni Studio	Google · VeoVeo 3.1	OpenAISora 2	RunwayGen-4
النصّ داخل الكادر	رائد فئته. الثلثيات والملصقات والتسلسلات الأبجدية تثبت.	جيّد. التعليقات القصيرة تعمل.	محدود. ينحرف في النصوص الطويلة.	جيّد. نصّ العلامة التجارية مقبول.
تحرير متعدد الجولات	دردشة أصلية. المشهد والشخصية يثبتان.	إعادة توجيه يدوية.	إعادة توجيه يدوية.	إعادة توجيه يدوية.
صوت طبيعي	صوت + SFX + خلفية بيئية في مرور واحد.	محدود. SFX فقط.	إخراج صامت.	إخراج صامت.
مدخلات مرجعية	صورة، فيديو، صوت، رسم. حتى 5 مدمجة.	صورة فقط.	صورة ومقطع قصير.	صورة وفرشاة حركة.
مدّة الإخراج	10 ثوانٍ كقاعدة، قابلة للسلسلة عبر الدردشة.	8 ثوانٍ.	من 8 إلى 20 ثانية حسب الباقة.	10 ثوانٍ.
المصدر	علامة SynthID مائية، قابلة للتحقّق.	علامة SynthID مائية.	بيانات C2PA الوصفية.	بيانات C2PA الوصفية.
الأنسب لـ	المبدعون والمعلّمون وفرق العلامات التجارية الذين يُسلّمون فيديو جاهزًا للنشر.	صنّاع الأفلام الباحثون عن مظهر سينمائي خالص.	محتوى قصير قائم على السرد.	تصميم الحركة وخطوط عمل VFX.

لقطة لحظيّة. السوق يتحرّك بسرعة، ونحدّث الجدول شهريًّا.

الأسعار

الباقات نفسها كما في Gemini.
بدون رسوم خفيّة.

أسعار Google تُمرّر كما هي، مع رسم ثابت لكلّ مقعد.

Plus

$20/شهر

حتى 200 دقيقة شهريًّا.

200 دقيقة / شهر
مقاطع 10 ثوانٍ · 1080p · صوت مفعّل
علامة SynthID مائية
Library & templates

موصى به

Pro

$30/شهر

أولوية في الطابور وتحسينات بلا حدود.

1,000 دقيقة / شهر
أولوية في الطابور · معالجة أسرع
تحسينات حوارية بلا حدود
تمرير API شخصي
إعدادات دقّة أعلى

Ultra

$100/شهر

مساحة عمل مشتركة للفرق.

إنشاءات بلا حدود
مساحة عمل للفريق (5 مقاعد)
Brand kit & asset library
دعم بأولوية
Audit log & SSO

الأسئلة

أسئلة ستطرحونها على الأرجح.

إن لم يكن سؤالكم هنا، أرسلوا لنا رسالة.

01ما هو Gemini Omni بالضبط؟

Gemini Omni هو أوّل نموذج متعدد المدخلات والمخرجات من Google DeepMind، أُعلن عنه في 19 مايو 2026 ضمن مؤتمر I/O. نموذج واحد، تمريرة واحدة: يقرأ النصّ والصور والصوت والفيديو، ويُخرج فيديو بصوت طبيعي. يخلف عائلة Veo ويستوعب قدرات Nano Banana (تحرير الصور) وGenie (العوالم التفاعلية). Omni Studio هو واجهتنا فوقه، دون أي ارتباط مع Google. نمرّر واجهات Gemini وVertex الرسمية (فور توفّرها) بدون أي رسوم إضافية.

02ما الذي يمكن إدخاله، وما الذي يخرج؟

At launch, in: text, up to 5 reference images, a voice reference, a video clip, or sketches. Out: 10s clips, 16:9 aspect ratio, 1080p, with native audio. Image and audio outputs are on Google's roadmap and we'll surface them when they land.

03كيف تعمل التحسينات الحوارية؟

دُرِّب Omni على التحرير متعدد الجولات، فيحافظ على ثبات المشهد عبر التحسينات. بعد التوليد، تكتبون أشياء من قبيل "اجعل الإضاءة أدفأ" أو "استبدل الخلفية"، فيُعيد النموذج المعالجة محتفظًا بالشخصيات والحركة ومسار الكاميرا. كلّ تحسين يُصبح عقدة جديدة في شجرة مكتبتكم، يمكنكم التفرّع منها والمقارنة بحريّة.

04ما هو SynthID، ولماذا يهمّ؟

SynthID هو علامة Google المائية الخفيّة، مدمجة في كلّ مخرج من Omni. غير محسوسة للعين، لكن يمكن التحقّق منها عبر تطبيق Gemini وChrome وبحث Google. تصمد أمام إعادة الترميز والاقتصاص وتسجيل الشاشة. المصدر ليس خيارًا اختياريًّا: كلّ مقطع تُنشئونه هنا يخرج موقّعًا.

05كيف تتعاملون مع الصوت والوجوه؟

تعديل الصوت محدود عند الإطلاق (قرار من Google) حتى يجهز تطبيق أكثر أمانًا. يمكنكم إرسال مرجع صوتي، لكن لاستخدام صوتكم كأفاتار، عليكم أوّلًا تسجيل تسلسل قصير من الأرقام (وسيلة الحماية الرسمية ضدّ التزييف العميق). جميع المخرجات تحمل علامة SynthID المائية، والمنصّة مخصّصة لمن تجاوزوا الثامنة عشرة.

06متى تنطلق واجهة API، وما تسعيرتها؟

Google said 'in the coming weeks' on May 19. الأسعار isn't public yet. Press projections sit around $0.10-0.30 / sec for video output. We'll pass Google's pricing through with no markup and bill the seat ($20-100/شهر) on top. Join the API waitlist above to get keys the day it goes live.

07هل يمكنني الإلغاء في أيّ وقت؟ وماذا عن الاسترداد؟

نعم. الإلغاء يتمّ من الإعدادات مباشرة، بلا بريد إلكتروني وبلا تعقيد. الدقائق غير المستخدمة تنتقل إلى الشهر التالي لمدة 30 يومًا. إن ألغيتم خلال 14 يومًا من الدفع، نُرجع المبلغ كاملًا، بدون أسئلة وبدون نماذج.

08أين تُحفظ بياناتي؟ هل تُستخدم في التدريب؟

الموجّهات والمخرجات تُحفظ على Vercel Blob Storage (المنطقة الافتراضية أوروبا، الولايات المتّحدة كخيار). لا نستخدم إنشاءاتكم لتدريب نماذجنا. تخضع معالجة Google الكامنة لشروط استخدام بيانات واجهة Gemini. خدمة عدم الاحتفاظ بالبيانات (Zero Data Retention) متاحة في باقتي Pro وUltra.

أنشئوا فيديو
من أيّ مدخل،
مع Gemini Omni.

اكتبوا أول موجّه لكم.
وشاهدوا ما يصنعه Omni.

استوديو واحد. أربع طرق للإبداع.

صنّاع المحتوى القصير

Brand & marketing

Explainers & education

Agencies & studios

جدار من الإبداعات.

أحضِروا ما لديكم. وامزجوه كما تشاؤون.

لغة طبيعية

صور مرجعية

مرجع صوتي

مقطع فيديو

ست شهادات مبكّرة. وخيط واحد يجمعها.

Gemini Omni Flash، بالأرقام.

ثلاث خطوات. استوديو واحد.

كوّنوا اللقطة عبر ستة محاور

شاهدوا المعالجة وهي تجري

حسّنوا اللقطة بالحوار

ما يفعله Gemini Omni فعلاً.

رسم النصّ داخل الكادر

تحرير متعدد الجولات

أيّ مرجع، أيّ صيغة

إخراج الكاميرا

صوت طبيعي ومؤثرات SFX

نقل الأسلوب

حركة تحترم الفيزياء

ثبات الشخصيات

علامة SynthID المائية

Gemini Omni في مواجهة البقية.

الباقات نفسها كما في Gemini.
بدون رسوم خفيّة.

أسئلة ستطرحونها على الأرجح.

ابدؤوا الإنشاء اليوم. ثلاث عمليات على حسابنا.

أنشئوا فيديومن أيّ مدخل،مع Gemini Omni.

اكتبوا أول موجّه لكم.وشاهدوا ما يصنعه Omni.

استوديو واحد. أربع طرق للإبداع.

صنّاع المحتوى القصير

Brand & marketing

Explainers & education

Agencies & studios

جدار من الإبداعات.

أحضِروا ما لديكم. وامزجوه كما تشاؤون.

لغة طبيعية

صور مرجعية

مرجع صوتي

مقطع فيديو

ست شهادات مبكّرة. وخيط واحد يجمعها.

Gemini Omni Flash، بالأرقام.

ثلاث خطوات. استوديو واحد.

كوّنوا اللقطة عبر ستة محاور

شاهدوا المعالجة وهي تجري

حسّنوا اللقطة بالحوار

ما يفعله Gemini Omni فعلاً.

رسم النصّ داخل الكادر

تحرير متعدد الجولات

أيّ مرجع، أيّ صيغة

إخراج الكاميرا

صوت طبيعي ومؤثرات SFX

نقل الأسلوب

حركة تحترم الفيزياء

ثبات الشخصيات

علامة SynthID المائية

Gemini Omni في مواجهة البقية.

الباقات نفسها كما في Gemini.بدون رسوم خفيّة.

أسئلة ستطرحونها على الأرجح.

ابدؤوا الإنشاء اليوم. ثلاث عمليات على حسابنا.

أنشئوا فيديو
من أيّ مدخل،
مع Gemini Omni.

اكتبوا أول موجّه لكم.
وشاهدوا ما يصنعه Omni.

الباقات نفسها كما في Gemini.
بدون رسوم خفيّة.