2026년 2월, 생성형 AI의 문법이 또 한 번 거대하게 요동치고 있다. 지난 몇 년간 텍스트를 입력해 그림 한 장이나 짧은 영상을 얻어내는 2D 평면의 결과물에 만족했다면, 이제는 내가 상상한 세계를 통째로 생성하고 그 안을 직접 걸어 다닐 수 있는 월드 모델(World Model) 기술이 빠르게 현실화되고 있다. 구글 딥마인드를 비롯한 글로벌 빅테크가 주도하는 이 혁신은 단순한 테크 화제를 넘어, 스토리텔링과 일상의 루틴을 근본적으로 해체하고 재조립하고 있다.

텍스트 한 줄이 3D 세계가 되다
가장 주목할 진화는 구글 딥마인드가 Genie 2 발표 이후 이어가고 있는 차세대 월드 모델 기술의 발전이다. "비가 내리는 사이버펑크 스타일의 네온사인 골목길, 바닥에는 물웅덩이가 있고 멀리서 재즈 음악이 들려오는 곳"이라는 텍스트 프롬프트를 입력하면, AI는 연속성을 가진 3D 공간을 직조해 낸다. 사용자는 키보드와 마우스, 혹은 VR 기기를 통해 방금 태어난 그 세계 속으로 걸어 들어가 상호작용할 수 있는 단계로 빠르게 나아가고 있다. 평면적인 이미지를 넘어 시공간의 물리적 법칙까지 이해하고 시뮬레이션하는 월드 모델의 발전은 창작의 궤적을 텍스트 투 이미지(Text-to-Image)에서 텍스트 투 3D 월드(Text-to-3D World)로 이동시키고 있다.
공간 창조의 권력, 개인에게 넘어오다
이는 크리에이터 이코노미에 거대한 지각 변동을 예고한다. 그동안 게임이나 메타버스, 인터랙티브 아트를 구축하기 위해서는 수십 명의 코딩 전문가와 3D 모델러, 방대한 렌더링 시간이 필요했다. 하지만 월드 모델 기술의 발전으로 단 한 명의 작가나 기획자가 서사를 짜고 곧바로 그 무대를 시각화하는 1인 세계 창조의 가능성이 열리고 있다. 소설가는 독자에게 텍스트를 읽히는 것을 넘어, 소설 속 배경을 3D로 생성해 독자가 그 안을 탐험하게 만드는 스토리두잉(Storydoing)의 영역으로 진입할 수 있다. 거대 자본이 독점하던 공간 창조의 권력이 개인의 상상력으로 이동하고 있다.
비서가 된 AI, 일상의 디지털 노동을 대행하다
창작의 혁명과 더불어 일상의 풍경도 극적으로 변하고 있다. 구글의 Project Mariner 등 AI 에이전트 기술의 고도화로 AI가 인간을 대신해 복잡한 웹 환경을 직접 항해하며 임무를 수행하는 자동화 기능이 빠르게 확장되고 있다. "다음 달 15일 제주도행 가장 저렴한 항공권을 예매하고, 평점 4점 이상의 해변 근처 호텔을 예약한 뒤, 잘 안 쓰는 스트리밍 서비스 구독을 취소해 줘"라고 명령하면, AI는 브라우저를 열어 다단계의 클릭과 정보 입력을 스스로 처리하는 방향으로 진화하고 있다. 화면 밖에서 정답만 뱉어내던 챗봇이, 이제는 사용자의 실무 비서가 되어 절차적인 디지털 노동을 대행하는 에이전트 시대가 열리고 있다.

설계의 파트너가 된 AI, 윤리 논쟁도 함께
물론 월드 모델이 빚어낸 가상 세계의 저작권 문제나, 에이전트 AI가 사용자의 금융 정보와 개인 데이터를 어디까지 통제할 것인가 하는 보안 윤리 논쟁은 2026년 현재 가장 뜨거운 화두다. 기술의 가속도가 윤리 논의의 속도를 앞지르는 것은 분명한 현실이며, 이에 대한 국제 사회의 규범 마련이 시급하다.
그러나 이미 당겨진 기술의 방아쇠가 멈추지 않으리라는 것 역시 분명하다. 내가 쓴 문장 한 줄이 살아 숨 쉬는 세계가 되고, 나의 명령 한마디가 수십 번의 번거로운 클릭을 대신하는 시대. 우리는 이제 AI를 무엇을 그려달라고 지시하는 도구가 아니라, 어떤 세계를 함께 구축하고 살아갈 것인지 논의하는 설계의 파트너로 바라보아야 한다. 그림 한 장을 넘어 세계를 통째로 빚어내는 상상력의 문법이 지금 막 새롭게 쓰이고 있다.













