google.com, pub-9005101102414487, DIRECT, f08c47fec0942fa0

제논, 컴퓨터 직접 조작하는 ‘훈민 VLM 235B’ 공개…

시각 인지 기반 실행력 강화한 후속 모델 선봬… 액셔너블 AI 솔루션 ‘원에이전트’ 고도화 및 피지컬 AI 확장 발판 마련

컴퓨터 유즈·브라우저 유즈 역량 강화로 업무 실행력 고도화

GenOS 멀티테넌트 서빙 활용하여 단일 GPU에서도 범용, 특화 모델 동시 서빙 가능해 도입 부담 낮춰

기사보기 상단_1

생성형 AI 솔루션 전문 기업 제논(대표 고석태)은 컴퓨터 화면 내 요소를 정밀하게 식별하고 이를 직접 조작할 수 있는 VLM 모델 '훈민(Hunmin) VLM 235B'를 공개했다고 4일 밝혔다. 이번에 공개한 '훈민 VLM 235B(Hunmin_vlm_235b_v0.11_merged_cua)'는 지난해 7월 선보인 '훈민 32B'의 성능을 대폭 강화한 후속 버전이다. 기존 모델의 뛰어난 범용 지능을 유지하면서 시각적 인지 능력을 비약적으로 향상시켜 실무 환경에서의 실행력을 갖춘 것이 특징이다. 제논은 자사 AI 솔루션 '원에이전트(OneAgent)'의 업무 수행 역량을 극대화하기 위해 이번 모델 업그레이드를 진행했다. 

 

특히 컴퓨터 화면을 정확히 식별해 원하는 위치를 클릭하는 '컴퓨터 유즈(Computer Use)' 기술과 웹사이트를 넘나들며 복잡한 업무를 수행하는 '브라우저 유즈(Browser Use)' 역량 강화에 초점을 맞췄다. 사용자의 명령을 이해해 업무의 시작부터 완결까지 직접 수행하는 '액셔너블(Actionable) AI'로서의 완성도와 실효성을 높였다는 설명이다. 훈민 VLM 235B는 범용 모델이 가진 방대한 지식 체계 위에 실무 환경에서의 '실행력'을 이식하는 데 집중했다. 알리바바의 Qwen3-VL(235B) 모델을 기반으로 UI 이해 및 마우스 이동 경로 등 엄선된 1,000여 개의 시나리오를 학습해 업무 수행 역량을 향상시켰다. 또한 자사 생성형AI 플랫폼인 제노스(GenOS)의 멀티테넌트(Multi-tenant) 서빙 기능을 활용해, 별도의 인프라 확장 없이도 단일 GPU 자원에서 기존 서비스와 동시 구동이 가능하도록 설계했다. 

<이미지출처: 제논>

정교한 튜닝을 통해 특정 분야 학습 과정에서 범용 지능이 저하되는 '치명적 망각(Catastrophic Forgetting)' 현상도 성공적으로 완화했다. 내부 테스트 결과, 훈민 VLM 235B는 한국어 VLM 벤치마크 점수를 유지함과 동시에 정밀 조작(Fine-grained Manipulation) 영역에서 기존 모델 대비 3.9% 향상된 성능을 기록했다. 또한 일상 업무 수행(Daily Apps)에서 6.0%, 미디어 도구 조작(VLC)에서 13.5%의 향상된 수치를 보이며 웹 탐색 및 문서 작업 등 실무 과업에서의 뛰어난 활용성을 확인했다. 제논은 이번 모델에 적용된 시각 인지 기술을 고도화해 향후 피지컬 AI 영역으로 확장할 계획이다. 

 

현재 진행 중인 그라운딩(Grounding, 화면 요소 인식 능력) 역량 강화 PoC를 바탕으로 디지털 세계(SW)의 업무 능력을 물리적 환경(HW)으로 전이해 공정 자동화 기기나 서비스 로봇을 제어하는 '피지컬 원에이전트'의 초석을 다진다는 방침이다. 명대우 제논 부사장(CTO)은 "현재의 LoRA 튜닝 단계를 넘어 향후 풀 파라미터(Full Parameter) 학습으로 확장하고, 강화학습(RL) 및 시뮬레이션 기반 데이터 생성 파이프라인 고도화를 통해 자율 수행 능력을 지속적으로 업데이트할 것"이라며 "액셔너블 AI를 넘어 피지컬 AI까지 기술력을 단계적으로 확장해 산업 현장의 AI 전환을 실질적으로 이끄는 핵심 기술 기업으로 도약하겠다"고 밝혔다. 한편 제논은 '훈민 VLM 235B' 모델을 3일 글로벌 AI 커뮤니티인 허깅페이스(Hugging Face)에 오픈소스로 공개했다. 모델의 가중치뿐 아니라 학습 데이터 구성과 방법론 전체를 투명하게 공개함으로써 기술적 신뢰를 확보하고 국내외 AI 연구 생태계 발전에 기여한다는 방침이다.

IT개발자협동조합 기자단 기자 kodec@devtimes.co.kr
작성 2026.02.06 19:06 수정 2026.02.06 19:14

RSS피드 기사제공처 : 청년개발자신문 / 등록기자: IT개발자협동조합 기자단 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.
Shorts NEWS 더보기
디알젬의 거침없는 진격: 초음파까지 접수 완료!
삼성의 역습? 엔비디아의 1,500조 파트너 낙점!
벤츠E 300 주행후기, 음이온 2억개 공기정화, 연비향상 50%가 동시..
내 아이 입으로 들어가는 건 무조건 확인! 경기도 농업의 미친 변화
주말에 뭐해? 도서관에서 갓생 살자!
봄의 생명력으로 마음을 채우다
중동발 경제 한파 터졌다! 한일 재무수장 도쿄서 긴급 회동, 왜?
중동발 경제 쇼크, 우리는 살아남을 수 있을까요?
마약 치료 실적 5배 폭발! 경기도가 작정하고 만든 이것
노후파산의 비명, "남은 건 빚뿐입니다"
"내 집 재개발, 가만히 있다가 2년 날릴 뻔했습니다"
"버리면 쓰레기, 팔면 황금? 경기도의 역발상!"
안산 5km 철도 지하화…71만㎡ 미래도시 탄생
78만 평의 반전! 기흥호수의 대변신
2026 전세 쇼크: "이제 전세는 없습니다"
서울 살 바엔 용인? 수지 17억의 비밀
의사가 진료 중에 AI를 켠다?
벚꽃보다 찐한 설렘! 지금 일본은 분홍빛 매화 폭포 중
기름값 200달러? 중동 발 퍼펙트 스톰이 온다!
신학기 감염병 비상! "수두·볼거리" 주의보
2026 경기국제보트쇼의 화려한 개막
"1초라도 늦으면 끝장" 경기도 반도체 올케어 전격 가동!
엔비디아, 실적은 역대급인데 왜 주가는 폭락할까?
안성 동신산단, 반도체 소부장 거점 조성 본격화
서울 집값 폭락? 당신이 몰랐던 13%의 진실
대치동 은마아파트 화재 재건축 지연 논란까지 확산
미쳤다 서울 집값!” 1년 새 13% 폭등, 내 집 마련 꿈은 신기루인가..
몸짱 되려다 몸 망친다! SNS에서 산 그 약?, 사실은 독약!
유튜브 NEWS 더보기

일론 머스크의 경고, 2030년 당신의 책상은 사라진다

부의 이동심리, 타워팰리스가 던지는 경제적 신호

그대는 소중한 사람 #유활의학 #마음챙김 #휴식

나 홀로 뇌졸중, 생존 확률 99% 높이는 실전 매뉴얼

숨결처럼 다가온 희망. 치유.명상.수면.힐링

통증이 마법처럼 사라지다./유활도/유활의학/유활파워/류카츠대학/기치유

O자 다리 한국, 칼각 일본? 앉는 습관 하나가 평생 건강을 좌우한다

겨울마다 돌아오는 ‘급성 장폭풍’… 노로바이러스, 아이들 먼저 덮쳤다

아오모리 강진, 철도·항만·도심 모두 멈췄다… 충격 확산

경기도, 숨겨진 가상자산까지 추적했다… 50억 회수한 초정밀 징수혁신으로 대통령상 수상

간병 파산 막아라... 경기도 'SOS 프로젝트' 1천 가구 숨통 틔웠다 120만 원의 기적,...

100세 시대의 진짜 재앙은 '빈곤'이 아닌 '고독', 당신의 노후는 안전합니까...

브레이크 밟았는데 차가 '쭉'... 눈길 미끄러짐, 스노우 타이어만 믿다간 '낭패...

"AI도 설렘을 알까?"... 첫눈 오는 날 GPT에게 '감성'을 물었더니

응급실 뺑뺑이 없는 경기도, '적기·적소·적시' 치료의 새 기준을 세우다

GTX·별내선·교외선이 바꾼 경기도의 하루… 이동이 빨라지자 삶이 달라졌다

행복은 뇌에서 시작된다. 신경과학이 밝혀낸 10가지 습관

행복은 뇌에서 시작된다 신경과학이 밝혀낸 10가지 습관

자신을 칭찬할 수 있는 용기, 삶을 존중하는 가장 아름다운 습관

아이젠사이언스생명연, AI 신약 개발 초격차 확보 전략적 동행