2024년 말, 구글은 생성형 AI의 새로운 형태를 선보였다. 단순한 텍스트나 이미지가 아니라, 이제는 사용자의 프롬프트에 따라 실시간으로 반응하는 ‘가상 세계’를 만들어낸다. 이 기술의 이름은 ‘프로젝트 지니(Project Genie)’. 단순한 데모 이상의 의미를 지닌 이 실험은 생성형 AI가 ‘언어’ 중심의 도구에서 ‘세계’ 중심의 플랫폼으로 진화하고 있음을 보여준다.
구글이 개발한 월드 모델 ‘지니 3’를 기반으로, 프로젝트 지니는 텍스트 한 줄로 3D 환경을 생성하고 조작하며, 사용자와 상호작용할 수 있는 시뮬레이션 공간을 구성한다. 게임 개발, 콘텐츠 제작, 자율주행, 로봇 시뮬레이션까지 적용 범위는 기술 산업 전반으로 확장된다.
생성형 AI의 다음 단계가 어디를 향하는지, 그리고 이 기술이 어떤 구조로 작동하며, 어떤 산업적 함의를 지니는지 분석해본다.
![]() |
| 구글이 공개한 Genie 3 인터페이스. 출처: 지디넷코리아 |
구글 프로젝트 지니의 기술적 구조
프로젝트 지니는 구글 딥마인드의 ‘지니 3’(Genie 3)를 중심으로 작동한다. 지니 3는 월드 모델(Large World Model)로 분류되며, 기존의 LLM처럼 언어를 예측하는 것이 아니라, 사용자의 행동과 프롬프트에 따라 시각적 세계를 예측하고 구성하는 방식이다.
이를 위해 다음 세 가지 기술이 통합된다.
- 지니 3 (월드 모델): 사용자의 입력에 따라 다음 ‘프레임’을 예측해 실시간으로 가상 환경을 구성하는 블랙박스형 신경망.
- 나노 바나나 프로 (Nano Banana Pro): 이미지 프롬프트를 통해 환경 콘셉트를 설정하고, 시각 요소를 채워넣는 생성 모델.
- 제미나이 (Gemini): 지시어 처리와 대화 기반 인터페이스를 담당하는 LLM 계열의 모델.
현재 지니는 720p 해상도, 24fps로 실행되며, 실시간 반응형 환경 시뮬레이션을 구현할 수 있다. 월드 스케치, 탐험, 리믹스라는 세 가지 핵심 기능을 통해 사용자는 자신만의 세계를 구성하고 탐험하며 수정할 수 있다.
생성형 AI의 새로운 패러다임: ‘세계’를 만드는 기술
지금까지 생성형 AI는 주로 이미지나 텍스트, 음악 등 정적인 결과물에 집중해왔다. 그러나 프로젝트 지니는 인터랙티브한 환경 자체를 생성한다는 점에서 기존 모델과 결정적으로 다르다.
‘한 줄 프롬프트로 게임을 만든다’는 접근은 단순 자동화 이상이다. 월드 모델은 공간 정보, 물리 법칙, 인과관계를 고려해 행동-반응 시뮬레이션을 수행한다. 이는 LLM의 언어 모델 한계를 넘어서려는 시도이며, 로봇 훈련이나 자율주행, 공정 시뮬레이션 등에도 응용 가능하다.
구글뿐 아니라 테슬라(xAI), 오픈AI 등도 이 영역의 기술 경쟁에 뛰어들고 있으며, ‘지각하는 AI’ 또는 ‘AGI의 전 단계’로 여겨지고 있다.
게임과 콘텐츠 산업의 구조 변화
가장 빠르게 영향을 받고 있는 분야는 게임 산업이다. 프로젝트 지니 발표 직후, 글로벌 게임사들의 주가가 일제히 하락한 것은 이를 상징한다. 캐릭터 모델링, 맵 디자인, 시나리오 구성 등 개발자의 수작업이 줄어들 가능성에 대한 경계심이 산업 전반에 퍼지고 있다.
그러나 반대로, 기획력과 프롬프트 설계력이 경쟁력으로 부상할 수도 있다. 기존 게임 엔진과 지니가 결합된다면, 반복적이고 비용이 많이 드는 작업을 줄이는 대신, 창의적인 구성을 중심으로 산업이 재편될 수 있다.
이외에도 영화(콘셉트 아트 자동화), 교육(역사 체험형 콘텐츠), 국방(전술 훈련 시뮬레이션), 금융/제조(리스크 모델링 등)에서도 지니형 월드 모델은 확장성을 가진다.
현재 기술의 한계와 책임
지니는 아직 ‘프리뷰’ 수준의 실험적 프로토타입이다. 구글 공식 블로그에 따르면, 실제 환경에서는 다음과 같은 제약이 존재한다.
- 프롬프트 반영 시 일관성 부족
- 물리 법칙 구현의 정확도 미흡
- 세계 지속 시간 제한 (예: 1분 내외)
- 문자 인식 오류, 객체 왜곡 등
또한 구글은 책임 있는 AI 사용 가이드라인에 따라, 윤리적 문제(허위 환경 구성, 부정확한 시뮬레이션 등)에 대해 사용자의 주의를 요구하고 있다.
관련 Nysight
결론: 월드 모델, AGI를 향한 징검다리
‘프로젝트 지니’는 단순한 생성형 AI 도구가 아니다. 이는 AI가 언어를 넘어 ‘행동 가능한 세계’를 생성하는 능력으로 진화하고 있음을 보여준다. 기술의 완성도는 아직 낮지만, 방향성은 분명하다.
AI는 이제 인간의 명령을 수행하는 단순 생성기가 아니라, ‘현실을 시뮬레이션하고 구조화하는 시스템’으로 자리 잡기 시작했다. 이 흐름은 향후 AGI(범용 인공지능)의 기술적 조건으로 이어질 가능성이 높다.
향후 기술 경쟁의 핵심은 LLM이 아니라 ‘LWM’이 될 수도 있다. 지금 이 시점에서 프로젝트 지니를 이해한다는 것은, 미래 기술 패러다임의 전환을 미리 목격하는 것이다.
📌 참고자료
면책 문구:
본 글은 기술 정보 해설을 목적으로 작성되었으며, 구글 및 해당 기술의 상업적/윤리적 해석은 독자의 판단에 따릅니다.

0 댓글