파이썬으로 선형회귀 곡선을 그리곤 했는데, 이렇게 회귀분석이 나오니 반갑다.
오늘 내용은 다소 가볍게 들을 수 있었다.
1. 회귀분석의 역사적 배경

회귀 분석에서 회귀는 평균값으로 돌아간다는 의미이다.
Galton이라는 과학자가 부모와 자녀의 키 자료를 분석하고, 구간별 평균값을 이용해 직선을 그린 후 평균적인 선을 그었다.
신기한건, x축과 y축을 바꾸어도 선의 기울기는 비슷하게 나오는 것.
이를 통해 회귀분석의 결과는 부모-자식 간의 유전적인 비밀이 아니라, 회귀분석의 수학적 특성임을 알게 되었다고 한다.
해당 논문은 아래에서 볼 수 있다.
Galton, F. (1886). Regression Towards Mediocrity in Hereditary Stature. Journal of the Anthropological Institute of Great Britain and Ireland, 15, 246–263.2. 상관계수(Correlation)
한 변수가 변화할 때, 다른 변수가 어떤 방향으로 어떻게 변하는지 나타내는 통계지표이다.
선형회귀로 구한 값은 두 값의 물리적인 비례 관계가 아니라 상관 정도이다.
이걸 상관계수라고 한다.
3. 후기
오늘 내용은 정말 쉬워서 그냥 빠르게 넘어갔다.
오랜만에 파이썬으로 선형회귀 함수나 찾아보고 적으려고 했는데, 간만에 보니 생각이 잘 나지 않았다.
import numpy as np
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 5, 4, 5])
slope, intercept = np.polyfit(x, y, 1)
print(slope, intercept)역시 공부는 꾸준히 해야하고, 자주 들여다봐야 하는 듯 하다.
댓글을 불러오는 중...