선형 회귀 알고리즘
자주보이는 선형회귀
머신러닝, 딥러닝을 처음 공부하기 시작하면 선형회귀 라는 단어를 자주 보게된다.
수학 공부를 전혀 안했던 나로서 선형이라는 단어를 몰라서 그냥 되돌아간다는 느낌을 받는 단어였다.
이때부터 수학 공부에 중요성을 깨닫고 수학 공부를 다시 시작하는 계기가 되었다.
머신러닝에서 선형회귀란?
Linear Regression의 정의
Linear regression attempts to model the relationship between two variables by fitting a linear equation to observed data.... A linear regression line has an equation of the form Y = a + bX, where X is the explanatory variable and Y is the dependent variable. The slope of the line is b, and a is the intercept (the value of y when x = 0). Written by Yale[1]
선형 회귀 분석은 선형 방정식(Y = aX + b)을 관측된 데이터(observed data, 분석하기 위해 얻은 데이터)에 적합시켜 두 변수 사이의 관계를 모형화 한다. … 선형 회귀선은 Y = a + bX 형식의 방정식을 갖습니다. 여기서 X는 설명 변수이고 Y는 종속 변수입니다. 선의 기울기는 b이고 a는 절편(x = 0일 때 y 값)입니다.
글을 읽고 내가 정리한 바로는 두변수를 가지는 데이터들의 관계를 선형 방정식(직선)으로 나열함으로서 새로운 데이터가 가지는 값을 예측할 수 있게된다.
선형회귀 모델 성능 측정 방법
선형회귀의 선능을 측정하는 방법으로 효용함수, (혹은 적합도 함수), 비용함수 들을 사용할 수 있다.
참고문헌
1) “Linear Regression” The UNIVERSITY OF Yale. http://www.stat.yale.edu/Courses/1997-98/101/linreg.htm
2) gimmesilver, “회귀 모델에서 ‘회귀’란 무엇인가?”, branch, 2016.11.09, https://brunch.co.kr/@gimmesilver/17
3) 오렐리앙 제롱 (Aurelien Geron), Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow 핸즈온 머신러닝 2판, 박해선, 오라일리, 한빛미디어(주)(2021년 5판), 49p