
미국 매사추세츠공과대학교(MIT) 연구진이 인공지능(AI)과 컴퓨터 비전 기술을 결합해 로봇이 주변 환경을 실시간으로 이해하고 3차원 지도를 구성하는 새로운 자율 매핑 시스템을 공개했다. 이번 기술은 SLAM(Simultaneous Localization and Mapping)으로 불리는 자율 위치·지도화 과정의 병목을 대폭 개선하며, 복잡한 공간에서도 수천 장의 이미지를 몇 초 만에 처리하는 것이 가능해졌다.
복잡한 환경도 수 초 만에 지도화… SLAM 기술 한계 돌파
기존 SLAM 기법은 정교한 카메라 보정과 전문가의 튜닝이 필요하고, 실시간으로 처리할 수 있는 이미지 수가 제한적이라는 문제가 있었다. 환경이 복잡할 경우 왜곡이나 누적 오차도 커져 활용 범위가 좁았다. MIT는 이러한 한계를 극복하기 위해 이미지 데이터를 다수의 ‘서브맵’으로 나누고, 각 서브맵을 빠르게 정렬·결합하는 방식의 새로운 구조를 제안했다. AI는 장면의 형태적 특징을 즉시 파악하고, 전통적 기하학 기반 정합 알고리즘이 이를 보정해 속도와 정확성을 동시에 확보했다.
AI와 기하학을 결합한 ‘피지컬 AI’ 구현으로 산업 전반 응용 기대
이 연구는 MIT 항공우주공학부 대학원생 도미닉 매지오가 주도하고 임형태 연구원, 루카 칼로네 교수가 함께 참여했다. 연구팀은 이러한 성과를 “피지컬 AI의 실제 구현”이라고 정의했다. 피지컬 AI는 단순히 영상을 해석하는 수준을 넘어, 현실 공간을 스스로 감지하고 이해하며 행동으로 연결하는 지능 시스템을 뜻한다.
칼로네 교수는 “로봇이 더욱 복잡한 임무를 수행하기 위해서는 환경을 정교하게 표현할 수 있는 방식이 필요하다”며 “현장에서 활용되기 위해서는 구현 과정이 단순해야 하는데, 이번 연구는 그 두 가지 조건을 모두 충족했다”고 설명했다.
특히 연구팀은 ‘서브맵 변형 정렬(submap deformation alignment)’이라는 수학적 접근을 활용해 서브맵 간 왜곡 차이를 정밀하게 보정했다. 그 결과 기존 대비 약 10배 빠른 속도로 3D 공간을 재구성하면서도 평균 오차는 5cm 이하에 머무르는 성능을 입증했다. MIT 캠퍼스의 복잡한 사무공간 복도나 예배당 내부 구조를 일반 스마트폰 카메라만으로 고정밀 3D 지도화하는 데도 성공했다.
재난·물류·XR 활용성 부각… 스마트 로보틱스 전환 가속
이 기술은 재난 구조, 물류 자동화, XR(확장현실) 등 다양한 산업 분야에서 즉시 활용될 수 있을 것으로 예상된다. 광산 붕괴나 지진 현장에서 구조 로봇은 실시간으로 경로를 탐색하고 구조 포인트를 식별할 수 있다. 물류센터의 이동형 로봇은 최적 동선을 신속히 학습해 업무 효율을 극대화할 수 있으며, VR·AR 기기는 실제 공간을 즉시 스캔해 몰입감 높은 3D 환경을 제공할 수 있다. 카메라 보정이나 전용 장비 없이도 동작한다는 점에서 범용 디바이스 기반의 AI·로봇 융합 생태계 확장에도 의미가 크다.
매지오 연구원은 “단순히 딥러닝을 확장하는 것만으로는 실시간 환경 인식의 한계를 넘을 수 없었다”며 “AI 모델에 기하학 기반 정합 원리를 통합한 것이 완전히 새로운 성능을 만들었다”고 말했다. 칼로네 교수는 “AI의 블랙박스적 성격을 보완해 해석 가능한 구조로 결합하는 것이 앞으로의 대규모 피지컬 AI 시스템의 핵심이 될 것”이라고 강조했다.
MIT는 AI와 기하학적 정합 방식의 결합으로 기존 SLAM 기술의 속도·정확성 한계를 돌파했다. 복잡한 환경에서도 실시간 3D 지도화가 가능해지며, 로봇 자율성 향상과 XR·물류·재난 구조 등 다양한 산업 분야의 혁신을 촉진할 것으로 전망된다.
이번 연구는 로봇이 공간을 ‘본다’를 넘어 ‘이해한다’는 개념을 실제 기술로 구현했다는 점에서 피지컬 AI의 전환점을 의미한다. 복잡한 현실 환경 속에서 스스로 판단하고 행동하는 자율 지능 시스템의 상용화가 한층 빨라질 것으로 보인다.
















