google.com, pub-9005101102414487, DIRECT, f08c47fec0942fa0

[칼럼 - 이규철] AI교과서(25) : 회귀분석(Regression analysis)

▲이규철/한국공공정책신문 칼럼니스트 ⓒ한국공공정책신문

 [한국공공정책신문=김유리 기자]  


회귀분석의 개념


회귀분석(Regression analysis)이란 어떤 변수가 다른 변수와 어떤 상관관계에 있는지를 추정하기 위한 통계학적 기법의 하나이다. 원인이 되는 변수(설명변수)와 결과가 되는 변수(목적변수) 사이에 회귀식 y=ax+b로 표시되는 관계가 있다고 하면, 관측치로부터 최소제곱법이라고 하는 오차의 제곱의 합을 최소로 한다라고 하는 방법을 사용한다. 이에 따라 a, b가 요구되므로 이 회귀식을 바탕으로 장래 예측이나 요인 분석을 실시하는 방법을 말한다. 또 이것을 단회귀, 직선회귀 등이라고도 한다. 예컨대, 과거 생산량과 제조비용 데이터에서 회귀식을 구함으로써 미래 생산량에 대한 제조비용 예측이 가능하다. 생산량 1단위당 제조비용이 얼마나 증가하는지를 나타내는 기울기가 변동비로 나타나고 절편이 고정비로 나타난다.

 

회귀분석의 설명변수


단회귀가 설명변수는 하나인 반면, 여러 설명변수를 가질 경우, 다중회귀라고 불리며 복잡성도 올라간다. , 해결의 접근법은 단회귀와 같다. 다만, 그래프 등으로 나타내는 것과 같은 가시화는 하기 어려워진다. 이 경우는 주성분 분석 등을 이용해 차원을 압축하고 2차원 평면에서 플롯(plot)하는 방법을 취할 수도 있다. 설명변수가 늘어난다는 것은 설명변수끼리의 연관성도 복잡화되기 때문에 회귀가 불안정해지거나 해가 나오지 않는 등의 상태가 나온다.

 

설명변수의 차수


그다음에 설명변수의 차수가 올라간 것을 다항식 회귀라고 하고 y=ax2+bx+c와 같은 형식으로 표현이 된다. 이렇게 하면 직선뿐만 아니라 곡선적인 분포에도 대응할 수 있다. 다만 차수를 너무 높이면 미지의 데이터에 대해 크게 벗어나는 결과도 나올 수 있기 때문에 가능한 차수는 낮추도록 검토해야 한다. 이 밖에 샀다, 사지 않았다 등의 피설명변수0-1이 되는 경우의 것을 로지스틱(logistics) 회귀분석(regression analysis)이라고 하며, 확률값을 구하는 경우에 이용한다. 이때 사용되는 식은 loge{y/(1-y)}=ax+b와 같은 형태가 되어 통상의 y를 변환시킨 형태가 된다. 이것을 로짓 변환(logit transformation)이라고 한다. 이것으로 요구되는 곡선은 처음에는 천천히 추이하여, 어느 점 부근에서 급격하게 상승해서 마지막으로 수렴을 향하는 형태가 된다.

 

회귀식 구하는 방법


회귀식을 구하는 방법으로 최소 제곱법이 이용되는 경우가 많지만, 빗나간 값에 대해서 약하다는 점이 있다. 빗나간 값이 섞여 오면 그 결과에 끌려가기 쉽고, 미지의 데이터에 대한 예측이 허술한 상태가 된다. 이 회피대책으로 빗나간 값에 대해 패널티를 주거나 그 자체를 제외하거나 하는 방안을 취할 필요가 있다.

이 해결책으로는 LOWESS(회귀 smoothing)나 로우스(LOWESS) 평활화법은 영향을 받을 것 같은 점을 무시하거나 영향을 적게 하는 방법이다. 또한 L2 정규화, L1 정규화라고 불리는 방법도 있는데 이것은 최소제곱법으로 조립하는 방정식 안에 패널티를 주는 방법이다.

 

회귀분석의 타당성 검토


또한 신경망을 이용한 회귀분석도 널리 사용되고 있다. 타당성 검토다. 모델이 통계적으로 어느 정도 맞는지 검토하는데 '결정계수''F검정', 't검정'이라는 세 가지 값으로 판단한다. 결정계수 : 설명변수가 목적변수의 어느 정도를 설명할 수 있는지를 나타내는 값으로 0~1 사이의 값을 따서 기여율이라고 불리기도 한다. F검정(F-test) : 모델 전체의 타당성을 검토할 때 사용하는 값이다. F값의 유의확률(p-value)을 판단기준으로 사용한다. 유의확률의 비교는 99%의 경우에는 0.01이지만, 95%의 확률로 검정하는 경우에는 0,05와 비교하여 타당성을 검증한다. t검정 : 모델 전체의 타당성을 F검정시험으로 판단한 후에 각각의 파라미터 계수 a와 상수 b)의 타당성을 검증한다. 각각의 유의확률이 0.01보다 작으면 타당하다고 판단한다. 보다 정밀도가 높은 모델을 검토한다. 직선적인 식보다 곡선으로 나타내는 것이 더 현실에 맞는 경우도 있기 때문에 설명변수의 차수를 높이거나 하면 더 좋은 결과를 얻을 수도 있다.

 


이규철 / 법학박사(상법)

AI·GPT, SDGs&ESG 코치 및 강사

100세대학 크리에이터 및 칼럼니스트

생성AI와 챗GPT, SDGs·ESG경영전략,

글로벌 MBAtoCEO, 리더의 필승전략,

100세대학 행복디자인 매뉴얼 등 27

일본(와세다대),중국(복단대·화동정법대)




 

작성 2025.06.16 10:11 수정 2025.06.16 10:12

RSS피드 기사제공처 : 한국공공정책신문 / 등록기자: 김유리 무단 전재 및 재배포금지

해당기사의 문의는 기사제공처에게 문의

댓글 0개 (/ 페이지)
댓글등록- 개인정보를 유출하는 글의 게시를 삼가주세요.
등록된 댓글이 없습니다.
Shorts NEWS 더보기
이자가 안 나오는 금은 끝났다? 모르면 평생 후회하는 금값의 잔인한 진실..
"나이 들어서 그래" 노안인 줄 알고 방치했다가 한순간에 암흑 속으로…
이제 대형 건설사들 망하기 직전인가요? LH 공공주택에 목숨 거는 이유
베테랑 운전자도 예외 없는 여름철 차 안 3000ppm의 공포
HBM 필요한 건 나! 젠슨 황 방한에 요동치는 K증시, 역대급 수혜주 ..
112년 모아야 강남 입성?서울 아파트 초양극화, 주거 사다리 붕괴 쇼크..
조선시대에 롤러코스터가 있었다? 타자마자 기절하는 버스의 정체
서울시가 작정하고 만든 44kcal 미친 간식
매일 고개 숙인 당신, 어깨뼈가 실시간으로 갉아먹히는 중이다. 수술 피하..
금리 1.5%로 5억 대출? 삼성맨들이 쏘아올린 집값 폭등의 진실. 성과..
말 못 하는 아이의 마음, 인공지능이 1초 만에 읽어낸다고?.보호자 눈물..
타인의 삶을 바꾸고 내 수입도 바꾸는 기적의 융합 공식. 인체 8대 권역..
"너 망했잖아" 소리 듣던 48세 수석 디자이너의 소름 돋는 반전 근황
돈 없으면 광교에 집 사지 마라?" 역대급 반전 주택 등장!
숨 한 번 편하게 쉬고 싶다! 대도시 쓰레기 습격에 분노한 주민들
경기도 AI디지털배움터 가동…15만 도민을 위한 생성형 AI 및 키오스크..
카이스트가 알아낸 늙지 않는 세포 브레이크의 비밀
비만치료제 정체기 돌파할 뇌 신호 스위치, 마침내 풀렸다!
서울 한복판 지하에 40년 동안 숨겨진 역대급 비밀 공간의 정체
매매는 꽁꽁, 전세는 불타는 중! 지금 서울 부동산 시장에서 벌어지는 기..
만성 피로와 번아웃을 돈으로 바꾸는 역발상 비즈니스의 비밀
오늘부터 안 받으면 공중분해? 내 돈 25만 원 찾아가는 법
왜 가평·연천만 20만 원 주냐!" 난리 난 경기도 지원금 팩트 체크
작년보다 20% 급증! 응급실 실려 가기 싫으면 필독
경기도 사는데 이걸 모르면 손해? 우리 동네 주인공 되는 법!
지금 삼성 주식보다 이게 더 핫해? 8인치 반도체의 기막힌 반란
영구 혜택이라더니 이제 와서 중과세? 매입임대 잔혹사의 시작
충격 데이터! 코로나 낫고 30일 안에 사망할 확률 20배 폭증하는 이유..
유튜브 NEWS 더보기

일론 머스크의 경고, 2030년 당신의 책상은 사라진다

부의 이동심리, 타워팰리스가 던지는 경제적 신호

그대는 소중한 사람 #유활의학 #마음챙김 #휴식

나 홀로 뇌졸중, 생존 확률 99% 높이는 실전 매뉴얼

숨결처럼 다가온 희망. 치유.명상.수면.힐링

통증이 마법처럼 사라지다./유활도/유활의학/유활파워/류카츠대학/기치유

O자 다리 한국, 칼각 일본? 앉는 습관 하나가 평생 건강을 좌우한다

겨울마다 돌아오는 ‘급성 장폭풍’… 노로바이러스, 아이들 먼저 덮쳤다

아오모리 강진, 철도·항만·도심 모두 멈췄다… 충격 확산

경기도, 숨겨진 가상자산까지 추적했다… 50억 회수한 초정밀 징수혁신으로 대통령상 수상

간병 파산 막아라... 경기도 'SOS 프로젝트' 1천 가구 숨통 틔웠다 120만 원의 기적,...

100세 시대의 진짜 재앙은 '빈곤'이 아닌 '고독', 당신의 노후는 안전합니까...

브레이크 밟았는데 차가 '쭉'... 눈길 미끄러짐, 스노우 타이어만 믿다간 '낭패...

"AI도 설렘을 알까?"... 첫눈 오는 날 GPT에게 '감성'을 물었더니

응급실 뺑뺑이 없는 경기도, '적기·적소·적시' 치료의 새 기준을 세우다

GTX·별내선·교외선이 바꾼 경기도의 하루… 이동이 빨라지자 삶이 달라졌다

행복은 뇌에서 시작된다. 신경과학이 밝혀낸 10가지 습관

행복은 뇌에서 시작된다 신경과학이 밝혀낸 10가지 습관

자신을 칭찬할 수 있는 용기, 삶을 존중하는 가장 아름다운 습관

아이젠사이언스생명연, AI 신약 개발 초격차 확보 전략적 동행