
엔비디아가 인간의 상식적 판단을 모방하는 ‘물리 기반 AI(Physical AI)’ 기술을 한 단계 확장한 개방형 모델을 내놓았다. 회사는 1일(현지시간) 개최된 NeurIPS 행사에서 자율주행 연구용 오픈소스 비전-언어-행동(VLA) 모델 ‘알파마요-R1(Alpamayo-R1)’을 공개하며 복잡한 도로 상황에서 논리적 결정을 스스로 도출할 수 있는 구조를 구현했다고 밝혔다.
개방형 VLA 모델로 의사결정 전 과정 투명화
엔비디아에 따르면 알파마요-R1은 주행 과정의 상황을 단계적으로 분해하고 가능한 이동 경로를 비교한 뒤, 주변 정보와 조건을 조합해 최적의 판단을 도출하는 방식으로 설계됐다. 기존 자율주행 시스템이 단순히 센서 입력을 받아 이동 명령을 도출하는 구조였다면, 이번 모델은 텍스트와 이미지 정보를 동시에 해석하며 ‘왜 이런 결정을 내렸는지’를 자연어로 설명하는 특징을 지녔다.
예를 들어 자전거 전용도로가 감지될 경우, 차량은 해당 구역을 어떻게 인식했는지, 그리고 경로를 우회하는 이유까지 문장 형태로 서술할 수 있다. 내부 판단 과정을 외부에서 확인할 수 없던 기존 소프트웨어와 달리, 알파마요-R1은 의사결정 과정을 투명하게 제시해 엔지니어가 문제 원인을 조기에 파악하고 안전성을 향상시키는 데 도움이 된다.
시나리오 분해·경로 추론·이유 설명이 가능한 추론 기반 주행 구조 구축
해당 모델은 단순한 입력·출력 구조를 넘어서 추론·판단·제어의 모든 단계를 하나의 체계로 통합했다. 현재 자율주행 분야에서 가장 큰 약점으로 지적돼 온 ‘추론 능력의 부족’을 해결하기 위해 세 가지 기술적 축을 결합한 것이 핵심이다.
먼저 특정 행동이 선택된 이유를 인과적으로 설명하는 ‘사슬형 인과(Chain of Causation)’ 데이터를 구축해 결정의 근거를 구조화했다. 이 데이터셋은 자동 라벨링과 인력 검수를 조합해 기존 학습 자료에서 보기 어려웠던 ‘결정 이유’ 정보를 체계적으로 담아낸 것으로 평가된다.
두 번째로, 물리 세계 이해에 최적화된 비전-언어 모델 ‘코스모스-리즌(Cosmos-Reason)’과 확산 기반 궤적 생성 모듈을 하나의 프레임워크로 통합했다. 이를 통해 시스템은 주변 상황을 해석하는 동시에 그 물리적 조건에 적합한 차량 움직임을 함께 설계할 수 있도록 구성됐다.
마지막으로, 감독학습(SFT)을 통해 추론 표현 방식을 익히고 강화학습(RL)으로 판단의 정밀도를 끌어올리는 ‘다단계 학습 절차’가 적용됐다. 이 과정에서 대규모 추론 모델이 평가자 역할을 맡아 모델의 사고 과정과 실제 차량 행동이 얼마나 일치하는지를 검증하며, 추론과 행동 간의 일관성을 강화하도록 설계됐다.
모델 대형화·강화학습 통해 주행 안정성·일관성 크게 향상
엔비디아는 실험 결과 알파마요-R1이 기존 궤적 중심 모델 대비 경로 계획 정확도가 최대 12% 향상됐다고 설명했다. 폐쇄형 시뮬레이션에서는 도로 이탈률이 35% 감소했고 차량·장애물과의 근접 위험도 25% 줄었다. RL 단계를 거친 이후에는 추론 품질이 45% 상승하고 판단과 실제 주행 행동의 일치도 또한 37% 높아진 것으로 나타났다.
또한 모델 규모를 5억 파라미터에서 70억 파라미터까지 확장했을 때도 성능이 꾸준히 개선돼, 구조 자체가 대형화를 통한 성능 향상에 적합함이 확인됐다. 실제 차량 실험에서도 99ms 수준의 지연 시간으로 실시간 주행에 필요한 기준을 충족하며 도심 환경에서도 안정적인 주행을 수행한 것으로 보고됐다.
연구팀은 알파마요-R1을 “세계 최초의 개방형 추론 기반 VLA 모델”이라고 규정하며 레벨4 자율주행 기술을 지향하는 기업들에게 중요한 전환점이 될 것이라고 강조했다.
알파마요-R1은 자율주행 기술의 고질적 한계였던 ‘판단 과정의 불투명성’과 ‘추론 능력 부족’을 동시에 개선한 모델이다. 자연어 기반의 이유 설명 기능은 안전성 향상과 문제 진단에 실질적 도움을 줄 것으로 예상되며, 확장 가능한 구조는 차세대 자율주행 기술의 연구 속도를 높일 것으로 보인다.
자율주행 기술이 단순 자동화에서 ‘인간형 추론 체계’로 진화하는 흐름이 본격화되고 있다. 엔비디아의 알파마요-R1은 투명한 판단 근거를 제시하고 실제 물리 조건을 반영한 주행을 설계할 수 있는 모델로, 향후 고도 자율주행 시스템의 표준을 재정의할 중요한 기술로 평가된다.
















