google.com, pub-9005101102414487, DIRECT, f08c47fec0942fa0

카카오, '인간처럼 소통하는 AI' 시대 개막 선언!

한국적 맥락 최적화된 '통합 AI' 기술력 입증

감정·호흡까지 이해하는 'AI 대화의 진화’

이미지 검색 패러다임 변화: 'Kanana-v-embedding’

이미지=캔바, kanana-o

 

 

카카오가 사람과 같이 보고, 듣고, 말하는 고도화된 멀티모달 인공지능(AI) 기술의 연구 성과를 공식 발표하며, K-AI의 새로운 지평을 열었다. 특히 한국어와 한국 문화를 깊이 있게 이해하는 데 초점을 맞춘 독자적인 AI 모델들은 글로벌 선두 모델들과의 경쟁에서 우위를 점할 잠재력을 입증했다.

 

한국적 맥락 최적화된 '통합 AI' 기술력 입증

 

카카오는 최근 테크 블로그를 통해 통합 멀티모달 언어모델 카나나-오(Kanana-o)’와 멀티모달 임베딩 모델 ‘카나나-브이-임베딩(Kanana-v-embedding)’의 개발 과정과 벤치마크 결과를 상세히 공개했다. 이는 카카오가 자체적으로 구축한 AI 모델의 기술적 성숙도와 완성도를 재차 확인하는 계기가 되었다.

 

Kanana-o는 텍스트, 음성, 이미지를 동시에 인식하고 실시간으로 응답할 수 있는 통합 멀티모달 언어모델이다. 이 모델의 가장 큰 특징은 글로벌 모델 대비 한국어 맥락 이해 능력이 압도적이라는 점이다. 지난 5월 성능 공개 이후 지속적인 고도화를 거쳐, 마치 사람처럼 자연스럽고 풍부한 표현력을 갖추게 됐다.

 

카카오 개발팀은 기존 멀티모달 모델들이 텍스트 입력에서는 강점을 보였으나, 음성 대화 시에는 답변의 깊이가 얕아지고 추론 능력이 떨어지는 한계를 명확히 인식했다. 이를 극복하고자 Kanana-o의 지시 이행 능력을 대폭 강화했다. 그 결과, 사용자의 표면적인 질문을 넘어 숨겨진 의도와 복잡다단한 요구사항까지 정교하게 파악하고 처리할 수 있게 되었다.

 

감정·호흡까지 이해하는 'AI 대화의 진화’

 

Kanana-o는 자체 구축한 대규모 데이터셋을 활용해 학습을 진행함으로써, 다양한 종류의 입출력 모달리티(텍스트, 음성, 이미지)에서도 기존 언어모델의 성능을 일관되게 유지했다. 단순한 질의응답을 넘어 요약, 감정 및 의도 해석, 오류 수정, 형식 변환, 번역 등 복합적인 과업을 성공적으로 수행하는 수준으로 성능이 향상되었다.

 

특히, 음성 분야에서의 발전이 눈에 띈다. 고품질 음성 데이터와 직접 선호 최적화(Direct Preference Optimization, DPO) 기술을 적용하여 억양, 감정, 호흡 등을 세밀하게 학습시켰다. 이를 통해 기쁨, 슬픔, 분노, 공포 등 상황별로 생생한 감정 표현은 물론, 미묘한 음색이나 어조 변화에 따른 감정까지 인식하고 표현하는 능력이 대폭 향상됐다.

 

더불어 호스트와 게스트가 대화를 나누는 '팟캐스트' 형태의 데이터셋 구축을 통해 끊김 없이 자연스럽게 이어지는 '멀티턴(Multi-turn) 대화'까지 가능해졌다. 벤치마크 평가 결과, Kanana-o는 영어 음성 성능 면에서는 GPT-4o와 유사한 수준을 보였으나, 한국어 음성 인식, 합성, 감정 인식 능력에서는 비교 모델 대비 월등히 높은 성과를 기록하며 한국어 기반 AI 대화의 새로운 표준을 제시했다.

 

이미지 검색 패러다임 변화: 'Kanana-v-embedding’

 

함께 공개된 ‘Kanana-v-embedding’은 이미지 기반 검색의 핵심 동력으로 작용하는 한국형 멀티모달 모델이다. 이 모델은 텍스트와 이미지를 동시에 이해하고 처리하여 텍스트로 이미지를 검색하거나, 특정 이미지와 관련된 정보를 탐색하고, 이미지가 포함된 문서를 찾아내는 등의 기능을 지원한다.

 

이 모델은 실질적인 서비스 적용을 염두에 두고 개발되었기에, 한국어와 한국 문화에 대한 이해도가 매우 탁월하다는 강점을 지닌다. '경복궁', '붕어빵' 같은 한국 고유명사뿐만 아니라, '하멜튼 치즈'처럼 오타가 포함된 단어까지도 문맥을 통해 정확한 이미지를 찾아낸다. 또한, '한복 입고 찍은 단체 사진'과 같은 복합적인 검색 조건도 정확히 해석하여, 조건의 일부에만 해당하는 사진을 걸러내는 높은 변별력을 갖췄다.

 

현재 Kanana-v-embedding은 카카오 내부 광고 소재의 유사도 분석 및 심사 시스템에 이미 적용되어 활용되고 있다. 카카오는 향후 적용 범위를 비디오나 음성 등 다른 모달리티로 확장하여 더욱 폭넓은 서비스에 이 기술을 적용할 계획이다.

 

카카오가 선보인 Kanana 시리즈는 한국어 기반 AI 기술의 현주소를 한 단계 끌어올렸다는 평가를 받는다. Kanana-o는 단순 정보 제공을 넘어 감정을 이해하고 의도를 파악하는 '인간적인 대화'를 구현하며, Kanana-v-embedding은 한국 문화와 맥락에 최적화된 검색 혁신을 예고한다. 이러한 기술력은 카카오 서비스 전반에 걸쳐 사용자 경험을 극적으로 개선하고, 국내외 AI 시장에서 카카오의 기술 리더십을 공고히 하는 핵심 동력이 될 것으로 기대된다.

 

김병학 카나나 성과리더는 "카카오의 자체 AI 모델 카나나는 단순한 정보 나열 수준을 넘어, 사용자의 감정을 이해하고 친숙하게 대화하는 AI가 되도록 한국적 맥락의 이해와 표현력을 높이는 데 주력했다"고 밝혔다. 카카오는 현재 온 디바이스 환경에서 동작하는 모델의 경량화 연구와 더불어, MoE(Mixture of Experts) 구조를 적용한 고성능·고효율 모델인 'Kanana-2' 개발을 준비하고 있다. 이처럼 카카오는 지속적인 기술 진화를 통해 일상 속에서 사람처럼 상호작용하는 AI 구현에 박차를 가하고 있으며, 향후 글로벌 AI 경쟁 구도에 큰 영향을 미칠 전망이다.

 

 

명인자 칼럼리스트 기자 88hagee@gmail.com
작성 2025.12.16 11:24 수정 2025.12.16 11:24

RSS피드 기사제공처 : AI지구백과저널 / 등록기자: 명인자 칼럼리스트 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.
Shorts NEWS 더보기
서울 살 바엔 용인? 수지 17억의 비밀
의사가 진료 중에 AI를 켠다?
벚꽃보다 찐한 설렘! 지금 일본은 분홍빛 매화 폭포 중
기름값 200달러? 중동 발 퍼펙트 스톰이 온다!
신학기 감염병 비상! "수두·볼거리" 주의보
2026 경기국제보트쇼의 화려한 개막
"1초라도 늦으면 끝장" 경기도 반도체 올케어 전격 가동!
엔비디아, 실적은 역대급인데 왜 주가는 폭락할까?
안성 동신산단, 반도체 소부장 거점 조성 본격화
서울 집값 폭락? 당신이 몰랐던 13%의 진실
대치동 은마아파트 화재 재건축 지연 논란까지 확산
미쳤다 서울 집값!” 1년 새 13% 폭등, 내 집 마련 꿈은 신기루인가..
몸짱 되려다 몸 망친다! SNS에서 산 그 약?, 사실은 독약!
왜 나만 매번 상처받을까?
"앱 노가다 끝!" 바쁜 현대인을 위한 삼성의 새로운 치트키
도심 한복판 ‘비밀의 숲’ 열렸다... 물향기수목원서 천연기념물·멸종위기..
의외로 모르는 임윤찬 숨겨진 레전드 Autumn Leaves
지휘자만 모르게 준비한 서프라이즈 이벤트
지휘자가 클래식 음악에 중요한 이유
트럼프의 관세 장벽이 무너졌다. (美 대법원 6:3 판결)
비아그라 먹었더니… 심장이 좋아진다고?
정부가 찍었다… 아주대 성균관대, 바이오 판 뒤집나
코스피 5000 돌파? 내 지갑은 꽁꽁!!
숲속에 온 듯, 마음이 편해지는 뉴에이지 음악 테라피
유명한 클래식명곡 베스트 100곡 모음, 모차르트,쇼팽,베토벤,바흐,리스..
한국인이 가장 사랑하는 클래식 1위 #라흐마니노프 #조성진
내귀에 익숙한 곡인데 제목이?? 클래식 명곡을 찾아보세요 #클래식 #pi..
익숙한 클래식 음악 20가지
유튜브 NEWS 더보기

안성 전원주택 부지 매매 워케이션 추천 안성 금광면 땅 매매 기반시설 완료

이제 우리가 위험한 진짜 이유는?

#이언주 #무편집 #속도만 #빠르게 #출처 #공개 #진실 #진실은이긴다 #이언주증거 #애국의열단 #진...

[아카 미군점령기편 ⑥] 미군정은 어떻게 이승만과 한민당을 지원했을까?

리박언주 제명 빼박 영상! 이언주의 리박스쿨 강연, 손효숙 (리박스쿨 대표)이 사회 봤다! 매불쇼 해명, 모...

천상의 복지 혜택이 지상의 일상으로 침투하는 은혜의 패키지 - 웨스트민스터 소요리문답으로 읽는 현대 사회(3...

올리고네트웍스–한화리조트, 여행 플랫폼 공동 개발 추진

성범죄가 아니다?앤드류 체포된 진짜 죄명은?

예수성화릴레이 그리기운동 참여. 예수성화연구원. CCBS방송

대한민국 국민이 노벨평화상 후보로 추천됐습니다!

절망의 자각을 넘어 찬란한 영광으로 초대하는 거룩한 강권 - 웨스트민스터 소요리문답으로 읽는 현대 사회(31...

네이버에 “통합 환급서비스란?” 검색해봤습니다… 상단이 이렇게 바뀌었습니다

한예종 2026 입학식 축하공연

그리스도라는 원천에 우리를 접붙이는 성령의 신비로운 이식 수술 - 웨스트민스터 소요리문답으로 읽는 현대 사회...

AI가 대신 설명한다… 네이버·ChatGPT·Gemini 실증 공개 (마술이 아닙니다)

웨이블런트 오션, 2026년 제트서프 아카데미 본격 운영

AI가 지출을 찾아주고, 게임처럼 보상까지…구독 관리 서비스 ‘SubCut’ 주목

54세 왕비가 입대한 진짜 이유, 남 일이 아냐

천상의 자산이 지상의 실존으로 입금되는 경이로운 통로 - 웨스트민스터 소요리문답으로 읽는 현대 사회(29)

AI가 내 말을 대신 보낸다 제미나이 권한 설정 점검 필요