반응형

20210909

20211107

 

선형회귀 분석

 

Linear Regression

변수들 사이의 관계를 분석하는 데 사용하는 통계학적 방법입니다.

장점: 알고리즘의 개념이 복잡하지 않고 다양한 문제에 폭 넓게 적용할 수 있다는 것입니다.

y = W*x + b

비용 함수 : 평균 제곱 오차 mean square error

 

 

단순회귀 : 두 변수 사이의 관계일 경우

다중회귀 : 여러 개의 벼수를 다루는 그룹 변수가 여러개일 때 

 

단일회귀 분석 : 독립 변수가 1개일 때의 회귀분석

다중회귀 분석 : 독립 변수가 여러개인 경우의 회귀분석  -> 2차원 그래프로 시각화 하기 어렵다. 

이런 경우 2차원 평면상에 점을 찍을 수 있도록 주성분 분석 Principal Component Analysis, PCA 을 사용합니다 

 

독립변수가 늘면 회귀분석의 결과를 신뢰할 수 없거나 , 답을 구할 수 없는 경우가 발생한다는 문제가 있다. 

다중공선성 문제 Multicollinearity 문제 :

독립 변수들 각각은 선형 독립이어야 한다는 것이 회귀분석의 전제인데 독립변수의 수가 늘면 독립 변수들 사이에 존재하는 상관관계가 개입해 결과에 영향을 주는 것이다. 

 

20211108,20211109

다항식 회귀

단순회귀를 통해 구한 회귀 식은 선형 함수이므로 독립변수의 차수는 1이었습니다 .

다항식 회귀는 산포도의 점 분포가 곡선 상에 위치하는 느낌을 받을 때 차수를 올려 대응하는 회귀 분석 방법입니다. 

다항식 회귀는 선형 회귀의 한 종류입니다. 

회귀분석할 때는 독립 변수가 가급적 낮은 차수를 갖는 모델을 설계해서 과적합을 피하는 것이 중요하다. 

 

비용함수 : 평균제곱오차 mean square error

 

출처 : 텐서플로 첫걸음

반응형

'개념 정리' 카테고리의 다른 글

분류 이란?_20210829  (0) 2021.08.31
강화학습 이란?_20210828  (0) 2021.08.28
통계 기반 머신러닝이란?_20210826  (0) 2021.08.26
사고범위 문제 이란?_20210825  (0) 2021.08.25
전문가 시스템 이란 ?_20210824  (0) 2021.08.24

+ Recent posts