google.com, pub-9005101102414487, DIRECT, f08c47fec0942fa0

[칼럼 - 이규철] AI교과서(57) - 클러스터링(Clustering)

▲이규철/한국공공정책신문 칼럼니스트 ⓒ한국공공정책신문

 [한국공공정책신문=김유리 기자] 


클러스터링의 개념


데이터를 자동 분류, 데이터를 비슷한 특징을 가진 그룹으로 나누는 기술이다. 클러스터링(Clustering)은 비슷한 특징을 가진 데이터를 그룹으로 묶는 방법이다. 예컨대, SNS상의 사용자 행동에서 취미나 흥미가 비슷한 사람들을 같은 그룹으로 분류할 수 있다. 교사가 없는 것 중 하나이다. 마케팅과 의료 등 다양한 분야에서 활용되어 보다 효과적인 분석을 가능하게 한다.

 

클러스터링의 기본


클러스터링이란 데이터를 비슷한 특징을 가진 그룹(cluster)으로 나누는 방법이다. 예컨대, 당신이 많은 과일 데이터를 가지고 있고, 그것들을 사과’ ‘’ ‘포도처럼 그룹을 나누고 싶다고 생각했다고 해보자. 클러스터링은 그 작업을 자동으로 수행하기 위한 기법이다.


클러스터링의 주요 기법


첫째, K-means 클러스터링이다. K-means 클러스터링은 데이터를 미리 정한 수의 클러스터(cluster)로 나누는 방법으로 클러스터의 수를 결정한다. 예컨대, ‘세 그룹으로 나누고 싶다라고 정한다. 초기의 중심을 정한다. 각 그룹의 중심(centroid)을 무작위(random) 설정한다. 데이터를 그룹으로 나눈다. 각 데이터를 가장 가까운 중심에 할당한다. 중심을 다시 계산한다. 각 그룹의 중심을 다시 계산하고 다시 데이터를 할당한다. 반복이다. 그룹 분류가 안정될 때까지 이를 반복한다. 이 방법은 데이터가 많거나 명확하게 나누어져 있는 경우에 효과적이다


둘째, 계층적 클러스터링이다. 계층적 클러스터링은 데이터를 계층적으로 그룹화하는 방법이다. 여기에는 주로 두 가지 접근법이 있다. 응집형이다. 처음에 모든 데이터를 개별 클러스터로 시작해 가까운 클러스터(cluster)를 점점 연결한다. 분할형(Divisive)이다. 먼저 모든 데이터를 하나의 큰 클러스터로 만들고 서서히 클러스터를 나누어 간다. 이 방법은 데이터의 계층적 관계를 시각화하는 데 편리하다


셋째, DBSCAN이다. DBSCAN(Density-Based Spatial Clustering of Applications with Noise)은 데이터 밀도를 기반으로 클러스터를 찾는 방법이다. 데이터가 밀집된 부분을 클러스터로 취급하고 밀집되지 않은 부분을 노이즈(noise)’로 무시한다. 사전에 클러스터(cluster)의 수를 결정할 필요가 없고 형상이 불규칙한 데이터에 대해서도 유효하다.

 

클러스터링의 이용사례


마케팅이다. 고객을 비슷한 구매 경향을 가진 그룹으로 나누어 타겟을 좁힌 광고를 실시한다. 의료다. 환자의 증상이나 병력을 바탕으로 비슷한 질병을 가진 환자를 그룹화한다. 화상처리다. 화상 내의 영역을 그룹으로 나누어, 물체의 인식이나 세그먼테이션(segmentation)을 실시한다.

 

클러스터링 평가


클러스터링 결과가 좋은지 확인하기 위해서는 다음과 같은 방법이 있다. 실루엣(silhouette) 점수다. 각 데이터 포인트가 자신의 클러스터(cluster)에 얼마나 적합한지를 측정한다. 점수가 높을수록 클러스터가 잘 나누어져 있음을 나타낸다. 다비즈(Dubies)-볼다인(Bouldine) 지수다. 클러스터 사이의 거리와 클러스터 내의 편차를 비교하여 클러스터링의 품질을 평가한다.

 


이규철 / 법학박사(상법)

AI·GPT, SDGs&ESG 코치 및 강사

100세대학 크리에이터 및 칼럼니스트

생성AI와 챗GPT, SDGs·ESG경영전략,

글로벌 MBAtoCEO, 리더의 필승전략,

100세대학 행복디자인 매뉴얼 등 27

일본(와세다대),중국(복단대·화동정법대)

 

 

작성 2026.02.01 22:57 수정 2026.02.01 22:58

RSS피드 기사제공처 : 한국공공정책신문 / 등록기자: 김유리 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.
Shorts NEWS 더보기
자전거 타기와 인생은 똑 같다. 자전거와 인생 이야기 #쇼츠 #short..
자산 30억인데 밥 굶는다? 강남 노인들의 눈물겨운 흑자 도산
디알젬의 거침없는 진격: 초음파까지 접수 완료!
삼성의 역습? 엔비디아의 1,500조 파트너 낙점!
벤츠E 300 주행후기, 음이온 2억개 공기정화, 연비향상 50%가 동시..
내 아이 입으로 들어가는 건 무조건 확인! 경기도 농업의 미친 변화
주말에 뭐해? 도서관에서 갓생 살자!
봄의 생명력으로 마음을 채우다
중동발 경제 한파 터졌다! 한일 재무수장 도쿄서 긴급 회동, 왜?
중동발 경제 쇼크, 우리는 살아남을 수 있을까요?
마약 치료 실적 5배 폭발! 경기도가 작정하고 만든 이것
노후파산의 비명, "남은 건 빚뿐입니다"
"내 집 재개발, 가만히 있다가 2년 날릴 뻔했습니다"
"버리면 쓰레기, 팔면 황금? 경기도의 역발상!"
안산 5km 철도 지하화…71만㎡ 미래도시 탄생
78만 평의 반전! 기흥호수의 대변신
2026 전세 쇼크: "이제 전세는 없습니다"
서울 살 바엔 용인? 수지 17억의 비밀
의사가 진료 중에 AI를 켠다?
벚꽃보다 찐한 설렘! 지금 일본은 분홍빛 매화 폭포 중
기름값 200달러? 중동 발 퍼펙트 스톰이 온다!
신학기 감염병 비상! "수두·볼거리" 주의보
2026 경기국제보트쇼의 화려한 개막
"1초라도 늦으면 끝장" 경기도 반도체 올케어 전격 가동!
엔비디아, 실적은 역대급인데 왜 주가는 폭락할까?
안성 동신산단, 반도체 소부장 거점 조성 본격화
서울 집값 폭락? 당신이 몰랐던 13%의 진실
대치동 은마아파트 화재 재건축 지연 논란까지 확산
유튜브 NEWS 더보기

일론 머스크의 경고, 2030년 당신의 책상은 사라진다

부의 이동심리, 타워팰리스가 던지는 경제적 신호

그대는 소중한 사람 #유활의학 #마음챙김 #휴식

나 홀로 뇌졸중, 생존 확률 99% 높이는 실전 매뉴얼

숨결처럼 다가온 희망. 치유.명상.수면.힐링

통증이 마법처럼 사라지다./유활도/유활의학/유활파워/류카츠대학/기치유

O자 다리 한국, 칼각 일본? 앉는 습관 하나가 평생 건강을 좌우한다

겨울마다 돌아오는 ‘급성 장폭풍’… 노로바이러스, 아이들 먼저 덮쳤다

아오모리 강진, 철도·항만·도심 모두 멈췄다… 충격 확산

경기도, 숨겨진 가상자산까지 추적했다… 50억 회수한 초정밀 징수혁신으로 대통령상 수상

간병 파산 막아라... 경기도 'SOS 프로젝트' 1천 가구 숨통 틔웠다 120만 원의 기적,...

100세 시대의 진짜 재앙은 '빈곤'이 아닌 '고독', 당신의 노후는 안전합니까...

브레이크 밟았는데 차가 '쭉'... 눈길 미끄러짐, 스노우 타이어만 믿다간 '낭패...

"AI도 설렘을 알까?"... 첫눈 오는 날 GPT에게 '감성'을 물었더니

응급실 뺑뺑이 없는 경기도, '적기·적소·적시' 치료의 새 기준을 세우다

GTX·별내선·교외선이 바꾼 경기도의 하루… 이동이 빨라지자 삶이 달라졌다

행복은 뇌에서 시작된다. 신경과학이 밝혀낸 10가지 습관

행복은 뇌에서 시작된다 신경과학이 밝혀낸 10가지 습관

자신을 칭찬할 수 있는 용기, 삶을 존중하는 가장 아름다운 습관

아이젠사이언스생명연, AI 신약 개발 초격차 확보 전략적 동행