Создавайте видео с Gemini Omni из любого промпта

Q: Что можно подать на вход и что получится?

На старте: текст, до 5 референсных изображений, голосовой клип, видеоклип или скетчи. На выходе: ролики по 10 секунд, формат 16:9, 1080p, с нативным звуком. Изображения и аудио на выходе уже в дорожной карте Google - мы добавим, как только они выйдут.

Q: Когда выйдет API и сколько он будет стоить?

Google сказал «в ближайшие недели» 19 мая. Цены пока не опубликованы. По прогнозам прессы, около $0.10-0.30 за секунду видео. Мы пробросим цены Google без наценки, а сверху возьмём за подписку ($20-100/мес). Запишитесь в лист ожидания API выше, чтобы получить ключи в день запуска.

Сделано с Omni · за последние 24 часа

Стена с генерациями.

Кликните по любой плитке, чтобы переделать.

ONER

"When the person touches the mirror, transforms into a detailed monochrome line art drawing"

transform · 0:08via DeepMind

ZOOM

"Make the hand-shaped hole super zoom and magnify the ground it's looking at"

reimagine · 0:10via DeepMind

SOUND

"When the finger touches the animal toy, play the sound the animal makes"

sound · 0:08via DeepMind

CLAY

"Skeuomorphism stop-motion explainer of how the brain hippocampus works"

explainer · 0:18via DeepMind

VOXEL

"When the person touches the mirror, the entire environment turns into 3D voxel art"

transform · 0:08via DeepMind

MUSIC

"The lights of the apartments start turning on in sync with the music"

reimagine · 0:08via DeepMind

TEXT

"26 items, one per alphabet letter. Lower-third labels written on paper. 9 frames per item at 24fps."

text · 0:11via DeepMind

FIELD

"Transport the violinist to the image environment, sun-drenched grassy field"

multi-turn · 0:08via DeepMind

PUPPET

"When the person touches the mirror, transforms into a felted stuffed puppet with googley eyes and glasses"

transform · 0:08via DeepMind

ANGLE

"Change the camera angle to be over the violinist's shoulder"

multi-turn · 0:08via DeepMind

HOLO

"When the person touches the mirror, transforms into a vintage monochrome 3D line-art hologram inside a holodeck"

transform · 0:08via DeepMind

TEXT

"Word by word, one at a time. Each word appears with a different animated style, in rhythm with the audio."

text · 0:09via DeepMind

Открыть всю галерею →

Мультимодальный вход

Загрузите всё, что есть. Смешивайте свободно.

Объединяйте всё это в одном промпте.

01 · ТЕКСТ

Обычный язык

Опишите кадр. Опирайтесь на то, что модель уже знает.

/place  a quiet forest clearing
/light  golden hour, warm
/action a small fox approaches the camera, curious

02 · ИЗОБРАЖЕНИЯ × 5

Референсные изображения

До пяти референсных кадров.

03 · ГОЛОС

Референс голоса

Один клип. Запишите последовательность цифр, чтобы подтвердить свой.

04 · ВИДЕО

Видеоклип

Переделайте существующий клип. Смените стиль, объекты, перенесите движение.

Говорят бета-тестеры

Шесть ранних отзывов. Одна закономерность.

Промпт по шести осям - это главное. Мы задаём кадр, кадрирование, свет, действие и итеративно дорабатываем то, что уже есть. Время на концепт-борды сократилось на 80%.

Mira Tessier

Креативный директор · Foxglove Studio

Текст в кадре - это решающий аргумент. Продуктовый кадр с артикулом прямо в кадре, без обработки в After Effects. Три недели работы агентства за один день.

Rachel Kim

Бренд-лид · Northwind

Я преподаю физику в школе. Стоп-моушн объяснения раньше занимали неделю. С Omni я задаю диаграмму одним промптом, дорабатываю в чате, выпускаю за один урок.

Liam Patel

Educator · Klein & Co Academy

Правки через диалог обходят настройку параметров. «Сделай свет теплее» просто работает, и персонаж остаётся тем же человеком от кадра к кадру.

Sofia Garcia

YouTube-автор · 480 тыс. подписчиков

Нативный звук - вот что меня убедило. Голос синхронизируется с губами, акустика помещения, фоли, всё за один проход. В этом месяце сэкономил пост-продакшн дважды.

Ethan Brooks

Независимый режиссёр · Lumen Labs

Любой референс, до пяти одновременно. Стиль с постера, движение из клипа, голос из wav. Omni не сопротивляется - просто делает.

Maya Iwasaki

Бренд-дизайнер · Helio

Как это работает

Три шага. Одна студия.

От промпта до клипа и правок на одном экране.

ШАГ 01

Соберите по шести осям

Гайд по промптингу превращён в поля.

/cadrage wide-angle, oner
/style cinematic, grounded
/light warm, golden hour
/place forest clearing
/action fox approaches fire

⌘↵ Сгенерировать

ШАГ 02

Смотрите, как рендерится

Median 23 seconds. Live status & cost.

⏱ 0:23 до первого кадра

ШАГ 03

Дорабатывайте в диалоге

Правки через чат сохраняют целостность сцены.

сделай свет теплее

✓ перерендерил

добавь лёгкий туман

✓ keeping fox & camera path

⌘B Открыть чат

Возможности

Что Gemini Omni действительно умеет.

Каждая ячейка - то, что модель выдаёт стабильно, а не разовая удача.

01 · ТЕКСТ

Текст в кадре

Шрифт, который реально читается. Титры, постеры, алфавитные последовательности, брендинг в кадре.

02 · ДИАЛОГ

Многошаговое редактирование

Сгенерируйте, потом дорабатывайте в диалоге. Сцена остаётся цельной между правками.

03 · ВХОДЫ

Любой референс, любой формат

Изображение, видео, аудио, скетч. До пяти входов в одном промпте.

04 · КАМЕРА

Режиссура камеры

Долли, наезд, длинный план, через плечо. Кадрирование обычным языком - модель понимает.

05 · АУДИО

Нативный голос и SFX

Диегетический звук, фоновые слои, голос в губы. Без отдельного аудио-прохода.

06 · СТИЛЬ

Перенос стиля

От пластилина до воксельного арта и голограммы. Движение сохраняется, меняется только поверхность.

07 · ДВИЖЕНИЕ

Физика в движении

Шарики катятся, ткань ложится, вода отражает. Цепные реакции реально работают.

08 · ПЕРСОНАЖИ

Согласованность персонажей

Один человек от кадра к кадру, в любой среде, даже при смене стиля. Лица и одежда сохраняются.

09 · ПОДТВЕРЖДЕНИЕ

Водяной знак SynthID

Происхождение, которое можно проверить. Знак переживает сжатие, кадрирование и перекодировку.

Как Omni сравнивается

Gemini Omni против остальных.

Честно о том, где Omni лидирует, где наравне и где он не пытается конкурировать.

	Это мыOmni Studio	Google · VeoVeo 3.1	OpenAISora 2	RunwayGen-4
Текст в кадре	Лидер класса. Титры, постеры, алфавит держатся.	Хорошо. Короткие подписи работают.	Ограниченно. Уплывает на длинных текстах.	Хорошо. Бренд-текст приемлемо.
Многошаговое редактирование	Нативный чат. Сцена и персонаж остаются цельными.	Перепромпт вручную.	Перепромпт вручную.	Перепромпт вручную.
Нативное аудио	Голос + SFX + фон за один проход.	Ограниченно. Только SFX.	Без звука.	Без звука.
Референсные входы	Изображение, видео, аудио, скетч. До 5 одновременно.	Только изображение.	Изображение, короткий клип.	Изображение, motion brush.
Длина ролика	10 с базово, расширяется через правки в чате.	8 с.	8-20 с по тарифу.	10 с.
Происхождение	Водяной знак SynthID, проверяемый.	Водяной знак SynthID.	Метаданные C2PA.	Метаданные C2PA.
Подходит для	Авторы, преподаватели, бренд-команды - production-ready видео.	Кинематографисты в поисках чистого кино-лука.	Сюжетный короткий формат.	Motion-дизайн и VFX-процессы.

Снимок на сегодня. Поле меняется быстро, мы обновляем таблицу раз в месяц.

Тарифы

Те же планы, что у Gemini.
Без скрытых наценок.

Цены Google проходят напрямую. Сверху - фиксированная подписка.

Plus

$20/мес

До 200 минут в месяц.

200 мин / месяц
10-сек клипы, 1080p, звук
Водяной знак SynthID
Library & templates

Вопросы, которые вы зададите.

Если вашего нет в списке, напишите нам.

01Что такое Gemini Omni, если коротко?

Gemini Omni - первая any-to-any модель от Google DeepMind, представленная 19 мая 2026 года на I/O. Одна модель, один проход: читает текст, изображения, звук, видео и выдаёт видео с нативным звуком. Принимает эстафету у линейки Veo и впитывает возможности Nano Banana (редактирование изображений) и Genie (интерактивные миры). Omni Studio - наш фронтенд поверх неё, без аффилиации с Google. Мы пробрасываем официальные API Gemini и Vertex (когда они выйдут) без наценки.

02Что можно подать на вход и что получится?

At launch, in: text, up to 5 reference images, a voice reference, a video clip, or sketches. Out: 10s clips, 16:9 aspect ratio, 1080p, with native audio. Image and audio outputs are on Google's roadmap and we'll surface them when they land.

03Как работают правки в диалоге?

Omni обучен многошаговому редактированию и сохраняет сцену между правками. После генерации вы пишете «сделай свет теплее» или «поменяй фон», и модель перерендеривает, сохраняя персонажей, движение и траекторию камеры. Каждая правка - новый узел в библиотеке, можно ветвить и сравнивать.

04Что такое SynthID и почему это важно?

SynthID - невидимый водяной знак Google, встроенный в каждый ролик от Omni. Незаметен человеку, но проверяется через приложение Gemini, Chrome и Google Search. Устойчив к перекодировке, кадрированию и записи экрана. Происхождение не опционально: каждый ролик отсюда уходит подписанным.

05Как вы работаете с голосом и лицами?

Изменение голоса временно ограничено (решение Google), пока не появится более безопасная реализация. Можно подать референс голоса, но чтобы использовать свой голос как аватар, сначала запишите короткую последовательность цифр (официальная защита от дипфейков). Все ролики получают SynthID, доступ от 18+.

06Когда выйдет API и сколько он будет стоить?

Google said 'in the coming weeks' on May 19. Тарифы isn't public yet. Press projections sit around $0.10-0.30 / sec for video output. We'll pass Google's pricing through with no markup and bill the seat ($20-100/мес) on top. Join the API waitlist above to get keys the day it goes live.

07Можно ли отменить в любой момент? Возвраты?

Да. Отмена в настройках, без писем, без трения. Неиспользованные минуты переносятся на 30 дней. Если вы отмените в течение 14 дней после оплаты, мы возвращаем полную сумму за месяц, без вопросов и форм.

08Где хранятся мои данные? Используются ли они для обучения?

Промпты и результаты лежат в Vercel Blob Storage (по умолчанию ЕС, опционально США). Мы не используем ваши генерации для обучения. Под капотом обработка идёт по правилам API Gemini. Режим Zero Data Retention доступен в Pro и Ultra.

Создавайте видео
из любого ввода,
с Gemini Omni.

Напишите промпт.
Посмотрите, что сделает Omni.

Одна студия. Четыре сценария.

Короткий формат

Brand & marketing

Explainers & education

Agencies & studios

Стена с генерациями.

Загрузите всё, что есть. Смешивайте свободно.

Обычный язык

Референсные изображения

Референс голоса

Видеоклип

Шесть ранних отзывов. Одна закономерность.

Gemini Omni Flash, в цифрах.

Три шага. Одна студия.

Соберите по шести осям

Смотрите, как рендерится

Дорабатывайте в диалоге

Что Gemini Omni действительно умеет.

Текст в кадре

Многошаговое редактирование

Любой референс, любой формат

Режиссура камеры

Нативный голос и SFX

Перенос стиля

Физика в движении

Согласованность персонажей

Водяной знак SynthID

Gemini Omni против остальных.

Те же планы, что у Gemini.
Без скрытых наценок.

Вопросы, которые вы зададите.

Создайте что-нибудь сегодня. Три ролика за наш счёт.

Создавайте видеоиз любого ввода,с Gemini Omni.

Напишите промпт.Посмотрите, что сделает Omni.

Одна студия. Четыре сценария.

Короткий формат

Brand & marketing

Explainers & education

Agencies & studios

Стена с генерациями.

Загрузите всё, что есть. Смешивайте свободно.

Обычный язык

Референсные изображения

Референс голоса

Видеоклип

Шесть ранних отзывов. Одна закономерность.

Gemini Omni Flash, в цифрах.

Три шага. Одна студия.

Соберите по шести осям

Смотрите, как рендерится

Дорабатывайте в диалоге

Что Gemini Omni действительно умеет.

Текст в кадре

Многошаговое редактирование

Любой референс, любой формат

Режиссура камеры

Нативный голос и SFX

Перенос стиля

Физика в движении

Согласованность персонажей

Водяной знак SynthID

Gemini Omni против остальных.

Те же планы, что у Gemini.Без скрытых наценок.

Вопросы, которые вы зададите.

Создайте что-нибудь сегодня. Три ролика за наш счёт.

Создавайте видео
из любого ввода,
с Gemini Omni.

Напишите промпт.
Посмотрите, что сделает Omni.

Те же планы, что у Gemini.
Без скрытых наценок.