Omni Studio brengt Gemini Omni binnen jouw handbereik, het multimodale model van Google DeepMind. Breng tekst, tot vijf beelden, een stemreferentie of een clip in. Je krijgt een video met natief geluid en watermerk terug. En je verfijnt 'm in gesprek.
Geen aanmelding nodig om je eerste video te zien.
Omni voegt zich naar jouw workflow, niet andersom.
Eén beeld erin, een hook van 10 seconden eruit. Geen timeline.
Productopstellingen met tekst in beeld, gestuurd via gesprek.
Claymation-explainers, wetenschappelijke visualisaties, historische vignetten.
Concept boards, pitch-reels, style-transfer-varianten in serie.
Klik op een tegel om 'm te remixen.
Dit alles past in één enkele prompt.
Beschrijf het shot. Leun op wat het model al weet.
/place a quiet forest clearing /light golden hour, warm /action a small fox approaches the camera, curious
Tot vijf beelden als kader.
Eén voice-clip. Neem een korte reeks cijfers op om je eigen stem te claimen.
Remix een bestaande clip. Verander stijl, vervang elementen, breng beweging over.
De zes-assen-prompt is dé doorbraak. We zetten kadrering, licht en actie vast en itereren op wat er werkelijk staat. Concept-board-tijd met 80 % omlaag.
Tekst gerenderd in beeld is voor mij het scharniermoment. Producthero met de SKU in het frame, zonder After Effects. Drie weken bureauwerk op één middag.
Ik geef natuurkunde op de middelbare school. Stop-motion-explainers kostten een week. Met Omni prompt ik het schema één keer, verfijn in chat, publiceer binnen het lesuur.
Editen via gesprek verslaat elk parameter-gefrutsel. "Maak het licht warmer" werkt gewoon, en het personage blijft van shot tot shot dezelfde persoon.
Natief geluid heeft me overtuigd. Stem synchroon met de lipbeweging, ruimtegeluid, foley, alles in één pass. Twee keer mijn postproductie-budget gered deze maand.
Elke referentie, tot vijf gecombineerd. Stijl van een poster, beweging van een clip, stem van een wav. Omni werkt niet tegen, Omni levert.
Het eerste model in DeepMinds Omni-familie.
Van prompt tot clip tot edit, op één scherm.
De prompt-gids als velden.
Median 23 seconds. Live status & cost.
Gespreks-edits houden de scène consistent.
Negen capaciteiten die het model consistent levert. Geen cherry-picked demo.
Letters die je echt kunt lezen. Lower thirds, posters, alfabet-reeksen, branding in het kader.
Genereer en itereer pratend. De scène blijft consistent over edits heen.
Beeld, video, audio, sketch. Combineer tot vijf inputs in één prompt.
Dolly, push-in, oner, over-the-shoulder. Jij beschrijft het in woorden, het model voert het uit.
Diëgetisch geluid, ambient-lagen, stem synchroon met de lippen. Geen losse audio-pass.
Van claymation naar voxel-art tot hologram. Beweging blijft, alleen het oppervlak verandert.
Knikkers rollen, stof valt, water weerkaatst. Kettingreacties reageren echt in keten.
Dezelfde persoon van shot tot shot, door omgevingen en stijlwisselingen heen. Gezichten en outfits houden stand.
Herkomst die je kunt verifiëren. Het watermerk overleeft compressie, crop en re-encoding.
Eerlijke lezing: waar Omni voorop loopt, waar het gelijk is, en wat het niet probeert te zijn.
| Dat zijn wijOmni Studio | Google · VeoVeo 3.1 | OpenAISora 2 | RunwayGen-4 | |
|---|---|---|---|---|
| Tekst in beeld | Beste in zijn klasse. Lower thirds, posters, alfabet-reeksen houden stand. | Goed. Korte captions werken. | Beperkt. Wijkt af op lange tekst. | Goed. Branded tekst is redelijk. |
| Multi-turn editing | Natieve chat. Scène en personage blijven consistent. | Handmatig re-prompt. | Handmatig re-prompt. | Handmatig re-prompt. |
| Natieve audio | Stem + SFX + ambient in één pass. | Beperkt. Alleen SFX. | Stille output. | Stille output. |
| Referentie-inputs | Beeld, video, audio, sketch. Tot 5 gecombineerd. | Alleen beeld. | Beeld, korte clip. | Beeld, motion brush. |
| Output-lengte | 10 s basis, schakelbaar via chat-edits. | 8 s. | 8 tot 20 s afhankelijk van plan. | 10 s. |
| Herkomst | SynthID-watermerk, verifieerbaar. | SynthID-watermerk. | C2PA-metadata. | C2PA-metadata. |
| Ideaal voor | Creators, docenten en brand-teams die productieklare video opleveren. | Filmmakers op zoek naar een puur cinematische look. | Verhalend short-form. | Motion design en VFX-workflows. |
Google-prijzen, één-op-één doorberekend. Eén vast bedrag per seat erbovenop.
Tot 200 minuten per maand.
Voorrang in de wachtrij, onbeperkt verfijnen.
Gedeelde werkruimte voor teams.
Staat de jouwe er niet bij? Stuur ons een berichtje.
Gemini Omni is het eerste any-to-any-model van Google DeepMind, aangekondigd op 19 mei 2026 tijdens I/O. Eén model, één pass: het leest tekst, beelden, audio en video, en levert video met natief geluid op. Het neemt de Veo-lijn over en absorbeert de mogelijkheden van Nano Banana (beeldbewerking) en Genie (interactieve werelden). Omni Studio is onze interface erbovenop, zonder enige affiliatie met Google. We geven de officiële Gemini- en Vertex-API's (zodra beschikbaar) zonder opslag door.
At launch, in: text, up to 5 reference images, a voice reference, a video clip, or sketches. Out: 10s clips, 16:9 aspect ratio, 1080p, with native audio. Image and audio outputs are on Google's roadmap and we'll surface them when they land.
Omni is getraind op multi-turn editing: het houdt de scène samen over edits heen. Na een generatie typ je dingen als "maak het licht warmer" of "wissel de achtergrond" en het model rendert opnieuw, met behoud van personages, beweging en cameraspoor. Elke edit wordt een nieuwe knoop in je library-tree, zodat je kunt vertakken en vergelijken.
SynthID is Googles onzichtbare watermerk, ingebakken in elke Omni-output. Voor mensen niet te zien, maar verifieerbaar via de Gemini-app, Chrome en Google Search. Het overleeft re-encoding, croppen en schermopname. Herkomst is geen optie: elke clip die je hier maakt gaat ondertekend de deur uit.
Stemmodificatie is bij de lancering beperkt (besluit van Google) totdat er een veiliger implementatie komt. Je kunt een stemreferentie aanleveren, maar om je eigen stem als avatar te gebruiken neem je eerst een korte cijferreeks op (de officiële deepfake-bescherming). Alle outputs zijn SynthID-watermarked en het platform is voor 18+.
Google said 'in the coming weeks' on May 19. Prijzen isn't public yet. Press projections sit around $0.10-0.30 / sec for video output. We'll pass Google's pricing through with no markup and bill the seat ($20-100/maand) on top. Join the API waitlist above to get keys the day it goes live.
Ja. Opzeggen vanuit de instellingen, zonder e-mail, zonder gedoe. Ongebruikte minuten zijn 30 dagen geldig. Zeg je binnen 14 dagen na betaling op, dan restitueren we de hele maand. Geen vragen, geen formulieren.
Prompts en outputs staan in Vercel Blob Storage (standaard EU-regio, US optioneel). We gebruiken je generaties niet voor training. De onderliggende verwerking bij Google volgt de Gemini-API-datavoorwaarden. Zero Data Retention is beschikbaar op Pro en Ultra.
Drie generaties cadeau. Geen kaart nodig.