Omni Studio - неофициальный плейграунд для Gemini Omni, мультимодальной модели Google DeepMind. Загрузите текст, до пяти изображений, голос или клип. Получите видео со звуком и водяным знаком. Редактируйте в диалоге.
Регистрация не нужна, чтобы увидеть первый рендер.
Omni вписывается в разные рабочие процессы.
Загрузите кадр, получите 10-секундный хук. Без таймлайна.
Продакт-плейсмент с текстом прямо в кадре, через диалог.
Пластилиновые ролики, научные визуализации, исторические сюжеты.
Концепт-борды, питч-ролики, варианты в новом стиле.
Кликните по любой плитке, чтобы переделать.
Объединяйте всё это в одном промпте.
Опишите кадр. Опирайтесь на то, что модель уже знает.
/place a quiet forest clearing /light golden hour, warm /action a small fox approaches the camera, curious
До пяти референсных кадров.
Один клип. Запишите последовательность цифр, чтобы подтвердить свой.
Переделайте существующий клип. Смените стиль, объекты, перенесите движение.
Промпт по шести осям - это главное. Мы задаём кадр, кадрирование, свет, действие и итеративно дорабатываем то, что уже есть. Время на концепт-борды сократилось на 80%.
Текст в кадре - это решающий аргумент. Продуктовый кадр с артикулом прямо в кадре, без обработки в After Effects. Три недели работы агентства за один день.
Я преподаю физику в школе. Стоп-моушн объяснения раньше занимали неделю. С Omni я задаю диаграмму одним промптом, дорабатываю в чате, выпускаю за один урок.
Правки через диалог обходят настройку параметров. «Сделай свет теплее» просто работает, и персонаж остаётся тем же человеком от кадра к кадру.
Нативный звук - вот что меня убедило. Голос синхронизируется с губами, акустика помещения, фоли, всё за один проход. В этом месяце сэкономил пост-продакшн дважды.
Любой референс, до пяти одновременно. Стиль с постера, движение из клипа, голос из wav. Omni не сопротивляется - просто делает.
Первая модель в семействе Omni от DeepMind.
От промпта до клипа и правок на одном экране.
Гайд по промптингу превращён в поля.
Median 23 seconds. Live status & cost.
Правки через чат сохраняют целостность сцены.
Каждая ячейка - то, что модель выдаёт стабильно, а не разовая удача.
Шрифт, который реально читается. Титры, постеры, алфавитные последовательности, брендинг в кадре.
Сгенерируйте, потом дорабатывайте в диалоге. Сцена остаётся цельной между правками.
Изображение, видео, аудио, скетч. До пяти входов в одном промпте.
Долли, наезд, длинный план, через плечо. Кадрирование обычным языком - модель понимает.
Диегетический звук, фоновые слои, голос в губы. Без отдельного аудио-прохода.
От пластилина до воксельного арта и голограммы. Движение сохраняется, меняется только поверхность.
Шарики катятся, ткань ложится, вода отражает. Цепные реакции реально работают.
Один человек от кадра к кадру, в любой среде, даже при смене стиля. Лица и одежда сохраняются.
Происхождение, которое можно проверить. Знак переживает сжатие, кадрирование и перекодировку.
Честно о том, где Omni лидирует, где наравне и где он не пытается конкурировать.
| Это мыOmni Studio | Google · VeoVeo 3.1 | OpenAISora 2 | RunwayGen-4 | |
|---|---|---|---|---|
| Текст в кадре | Лидер класса. Титры, постеры, алфавит держатся. | Хорошо. Короткие подписи работают. | Ограниченно. Уплывает на длинных текстах. | Хорошо. Бренд-текст приемлемо. |
| Многошаговое редактирование | Нативный чат. Сцена и персонаж остаются цельными. | Перепромпт вручную. | Перепромпт вручную. | Перепромпт вручную. |
| Нативное аудио | Голос + SFX + фон за один проход. | Ограниченно. Только SFX. | Без звука. | Без звука. |
| Референсные входы | Изображение, видео, аудио, скетч. До 5 одновременно. | Только изображение. | Изображение, короткий клип. | Изображение, motion brush. |
| Длина ролика | 10 с базово, расширяется через правки в чате. | 8 с. | 8-20 с по тарифу. | 10 с. |
| Происхождение | Водяной знак SynthID, проверяемый. | Водяной знак SynthID. | Метаданные C2PA. | Метаданные C2PA. |
| Подходит для | Авторы, преподаватели, бренд-команды - production-ready видео. | Кинематографисты в поисках чистого кино-лука. | Сюжетный короткий формат. | Motion-дизайн и VFX-процессы. |
Цены Google проходят напрямую. Сверху - фиксированная подписка.
До 200 минут в месяц.
Приоритетная очередь, безлимитные правки.
Общее пространство для команд.
Если вашего нет в списке, напишите нам.
Gemini Omni - первая any-to-any модель от Google DeepMind, представленная 19 мая 2026 года на I/O. Одна модель, один проход: читает текст, изображения, звук, видео и выдаёт видео с нативным звуком. Принимает эстафету у линейки Veo и впитывает возможности Nano Banana (редактирование изображений) и Genie (интерактивные миры). Omni Studio - наш фронтенд поверх неё, без аффилиации с Google. Мы пробрасываем официальные API Gemini и Vertex (когда они выйдут) без наценки.
At launch, in: text, up to 5 reference images, a voice reference, a video clip, or sketches. Out: 10s clips, 16:9 aspect ratio, 1080p, with native audio. Image and audio outputs are on Google's roadmap and we'll surface them when they land.
Omni обучен многошаговому редактированию и сохраняет сцену между правками. После генерации вы пишете «сделай свет теплее» или «поменяй фон», и модель перерендеривает, сохраняя персонажей, движение и траекторию камеры. Каждая правка - новый узел в библиотеке, можно ветвить и сравнивать.
SynthID - невидимый водяной знак Google, встроенный в каждый ролик от Omni. Незаметен человеку, но проверяется через приложение Gemini, Chrome и Google Search. Устойчив к перекодировке, кадрированию и записи экрана. Происхождение не опционально: каждый ролик отсюда уходит подписанным.
Изменение голоса временно ограничено (решение Google), пока не появится более безопасная реализация. Можно подать референс голоса, но чтобы использовать свой голос как аватар, сначала запишите короткую последовательность цифр (официальная защита от дипфейков). Все ролики получают SynthID, доступ от 18+.
Google said 'in the coming weeks' on May 19. Тарифы isn't public yet. Press projections sit around $0.10-0.30 / sec for video output. We'll pass Google's pricing through with no markup and bill the seat ($20-100/мес) on top. Join the API waitlist above to get keys the day it goes live.
Да. Отмена в настройках, без писем, без трения. Неиспользованные минуты переносятся на 30 дней. Если вы отмените в течение 14 дней после оплаты, мы возвращаем полную сумму за месяц, без вопросов и форм.
Промпты и результаты лежат в Vercel Blob Storage (по умолчанию ЕС, опционально США). Мы не используем ваши генерации для обучения. Под капотом обработка идёт по правилам API Gemini. Режим Zero Data Retention доступен в Pro и Ultra.
Три генерации в подарок. Карта не нужна.