Omni Studio는 Google DeepMind의 멀티모달 모델 Gemini Omni를 여러분의 손에 직접 전달합니다. 텍스트, 최대 5장의 이미지, 음성 레퍼런스 또는 클립을 넣어 보세요. SynthID 워터마크가 있는 사운드 포함 동영상이 돌아옵니다. 그리고 대화로 자연스럽게 다듬을 수 있습니다.
가입 없이 첫 동영상을 바로 보실 수 있습니다.
Omni는 여러분의 워크플로우에 자연스럽게 녹아듭니다.
이미지 한 장으로 10초 후킹 영상까지. 타임라인이 필요 없습니다.
화면 안에 텍스트가 새겨진 제품 컷을, 대화만으로 완성할 수 있습니다.
클레이메이션 익스플레이너, 과학 시각화, 역사 비네트.
콘셉트 보드, 피치 릴, 스타일 트랜스퍼 변주를 한 번에.
타일을 클릭하면 리믹스할 수 있습니다.
이 모든 것이 하나의 프롬프트에 어우러집니다.
장면을 설명해 주세요. 모델이 이미 알고 있는 지식에 기대시면 됩니다.
/place a quiet forest clearing /light golden hour, warm /action a small fox approaches the camera, curious
최대 5장까지 가이드로 사용할 수 있습니다.
음성 클립 한 개를 사용하실 수 있습니다. 본인 음성을 인증하시려면 숫자 시퀀스를 녹음해 주세요.
기존 클립을 리믹스해 보세요. 스타일 변경, 요소 교체, 동작 이식이 가능합니다.
여섯 축 프롬프트가 진짜 변화의 핵심이었습니다. 프레이밍, 빛, 액션을 선언하고 화면에 실제로 나타난 결과 위에서 반복하니, 콘셉트 보드 작업 시간이 80% 줄었습니다.
화면 안에 텍스트가 정확히 렌더링되는 것이 결정적이었습니다. SKU를 프레임 안에 새긴 제품 히어로를, After Effects 없이 만들 수 있었습니다. 대행사 3주 분량의 작업이 오후 한나절로 끝났습니다.
고등학교에서 물리를 가르치고 있습니다. 스톱모션 익스플레이너에 일주일씩 걸리던 작업이, Omni에서는 다이어그램을 한 번 프롬프트하고 채팅으로 다듬어 수업 시간 안에 공개할 수 있습니다.
대화로 편집하는 방식이 파라미터를 만지는 것보다 훨씬 낫습니다. "조명을 더 따뜻하게"가 그대로 작동하고, 컷이 바뀌어도 같은 인물이 유지됩니다.
네이티브 오디오가 결정적이었습니다. 입술 움직임에 동기화된 음성, 룸 톤, 폴리까지 한 번의 패스로 처리됩니다. 이번 달 포스트 프로덕션 예산을 두 번이나 살렸습니다.
어떤 레퍼런스든 최대 다섯 개까지 조합할 수 있습니다. 포스터에서 스타일을, 클립에서 모션을, wav에서 보이스를. Omni는 거부감 없이, 그저 일을 끝내 줍니다.
DeepMind Omni 패밀리의 첫 번째 모델입니다.
프롬프트에서 클립, 그리고 편집까지 한 화면에서 모두 진행됩니다.
프롬프트 가이드를 입력 필드로 옮겼습니다.
Median 23 seconds. Live status & cost.
대화 편집이 장면의 일관성을 유지합니다.
모두 모델이 일관되게 결과로 보여 주는 능력입니다. 일회성 데모가 아닙니다.
실제로 읽을 수 있는 글자가 그려집니다. 로워 서드, 포스터, 알파벳 시퀀스, 프레임 내 브랜딩.
먼저 생성하고, 그 다음 대화로 반복하세요. 편집을 거듭해도 장면의 일관성이 유지됩니다.
이미지, 비디오, 오디오, 스케치. 최대 5개의 입력을 하나의 프롬프트에 결합할 수 있습니다.
달리, 푸시인, 원컷, 오버 더 숄더. 말로 설명하시면 모델이 그대로 실행합니다.
디제틱 사운드, 앰비언트 레이어, 입술 동작에 동기화된 음성을 한 번에. 별도의 오디오 패스가 필요 없습니다.
클레이메이션부터 복셀 아트, 홀로그램까지. 모션은 유지하고 표면만 바뀝니다.
구슬이 굴러가고, 천이 떨어지고, 물이 반사합니다. 연쇄 반응도 실제로 연쇄로 일어납니다.
컷이 바뀌어도, 환경이 바뀌어도, 심지어 스타일이 바뀌어도 같은 인물이 유지됩니다. 얼굴과 의상도 그대로.
검증 가능한 출처를 함께 제공합니다. 워터마크는 압축, 자르기, 재인코딩 후에도 유지됩니다.
솔직하게 정리한 비교입니다. Omni가 앞서는 영역, 비등한 영역, 의도적으로 추구하지 않는 영역을 정리했습니다.
| 이것이 우리Omni Studio | Google · VeoVeo 3.1 | OpenAISora 2 | RunwayGen-4 | |
|---|---|---|---|---|
| 화면 내 텍스트 | 업계 최고 수준. 로워 서드, 포스터, 알파벳 시퀀스 모두 유지됩니다. | 양호. 짧은 캡션은 정상 작동. | 제한적. 긴 텍스트에서 흐트러집니다. | 양호. 브랜드 텍스트는 수용 가능한 수준. |
| 멀티턴 편집 | 네이티브 채팅. 장면과 캐릭터 일관성 유지. | 수동 재프롬프트. | 수동 재프롬프트. | 수동 재프롬프트. |
| 네이티브 오디오 | 음성 + SFX + 앰비언트 한 번에. | 제한적. SFX만 지원. | 출력은 무음. | 출력은 무음. |
| 레퍼런스 입력 | 이미지, 비디오, 오디오, 스케치. 최대 5개 조합. | 이미지만. | 이미지, 짧은 클립. | 이미지, 모션 브러시. |
| 출력 길이 | 기본 10초, 채팅 편집으로 이어붙이기 가능. | 8초. | 플랜에 따라 8~20초. | 10초. |
| 출처 | SynthID 워터마크, 검증 가능. | SynthID 워터마크. | C2PA 메타데이터. | C2PA 메타데이터. |
| 최적 용도 | 공개 가능한 품질의 비디오를 만드는 크리에이터, 교육자, 브랜드 팀. | 순수 시네마틱 룩을 추구하는 영상 작가. | 스토리 중심 쇼트폼. | 모션 디자인, VFX 워크플로우. |
Google의 가격을 그대로 전달합니다. 좌석 정액 요금만 위에 더해집니다.
월 최대 200분.
우선 큐, 편집 무제한.
팀을 위한 공유 워크스페이스.
이곳에 없는 질문은 언제든 문의해 주세요.
Gemini Omni는 Google DeepMind의 첫 any-to-any 모델로, 2026년 5월 19일 I/O에서 공개되었습니다. 하나의 모델이 단일 패스로 텍스트, 이미지, 오디오, 비디오를 이해하고, 네이티브 사운드가 포함된 비디오를 출력합니다. Veo의 계보를 잇고, Nano Banana(이미지 편집)와 Genie(인터랙티브 월드)의 기능을 함께 흡수했습니다. Omni Studio는 그 위에 올린 비공식 프론트엔드입니다. Google과는 무관하며, 공식 Gemini와 Vertex API(공개 이후)를 가산금 없이 그대로 전달합니다.
At launch, in: text, up to 5 reference images, a voice reference, a video clip, or sketches. Out: 10s clips, 16:9 aspect ratio, 1080p, with native audio. Image and audio outputs are on Google's roadmap and we'll surface them when they land.
Omni는 멀티턴 편집을 위해 학습되었으며, 편집을 거듭해도 장면의 일관성을 유지합니다. 생성 후 "조명을 더 따뜻하게"나 "배경을 바꿔 줘" 같은 메시지를 입력하면 캐릭터, 동작, 카메라 동선을 유지한 채 다시 렌더링합니다. 각 편집은 라이브러리 트리의 새로운 노드가 되며, 자유롭게 분기하고 비교할 수 있습니다.
SynthID는 Google의 보이지 않는 워터마크로, Omni의 모든 출력에 삽입됩니다. 사람의 눈에는 보이지 않지만 Gemini 앱, Chrome, Google 검색을 통해 검증할 수 있으며, 재인코딩, 자르기, 화면 녹화에도 살아남습니다. 출처는 선택 사항이 아닙니다. 이곳에서 생성되는 모든 클립에는 서명이 포함됩니다.
음성 변환 기능은 런칭 시 일시적으로 제한됩니다(Google의 결정). 더 안전한 구현이 마련될 때까지의 조치입니다. 음성 레퍼런스를 제출하실 수 있지만, 본인 음성을 아바타로 사용하시려면 먼저 짧은 숫자 시퀀스를 녹음해야 합니다(공식적인 딥페이크 방지 절차). 모든 출력에는 SynthID 워터마크가 적용되며, 본 플랫폼은 만 18세 이상 전용입니다.
Google said 'in the coming weeks' on May 19. 요금 isn't public yet. Press projections sit around $0.10-0.30 / sec for video output. We'll pass Google's pricing through with no markup and bill the seat ($20-100/월) on top. Join the API waitlist above to get keys the day it goes live.
가능합니다. 설정에서 바로 해지하실 수 있으며, 이메일이나 별도의 절차는 필요 없습니다. 사용하지 않은 분량은 30일간 이월됩니다. 결제 후 14일 이내에 해지하시는 경우 해당 월 금액 전액을 환불해 드리며, 별도의 질문이나 양식은 요구하지 않습니다.
프롬프트와 출력은 Vercel Blob Storage에 저장됩니다(기본 EU 리전, US 선택 가능). 사용자의 생성물을 학습에 사용하지 않습니다. Google 측 처리는 Gemini API의 데이터 이용 약관을 따릅니다. Zero Data Retention은 Pro와 Ultra 플랜에서 이용하실 수 있습니다.
3회 분량을 무료로 드립니다. 카드 등록 없이.