面向教师的教育研究与统计分析培训 - 第6讲 回归分析的起点

힘센캥거루
2025년 12월 23일(수정됨)
1
challenge

以前经常用 Python 画线性回归曲线,现在正式学到回归分析,感觉很亲切。

今天的内容听起来比较轻松。

1. 回归分析的历史背景

面向教师的教育研究与统计分析培训 - 第6讲 回归分析的起点-1

在回归分析中,“回归”是指回到平均值的意思。

科学家 Galton 分析了父母和子女身高的数据,利用区间平均值作图,画出一条直线,得到了一条代表平均趋势的线。

有趣的是,即使把 x 轴和 y 轴对调,直线的斜率也会得到相近的结果。

通过这一点,人们意识到回归分析的结果并不是父母与子女之间遗传秘密的体现,而是回归分析本身的一种数学特性。

这篇论文可以在下面看到。

Galton, F. (1886). Regression Towards Mediocrity in Hereditary Stature. Journal of the Anthropological Institute of Great Britain and Ireland, 15, 246–263.

2. 상관계수(Correlation)

当一个变量发生变化时,用来表示另一个变量会朝哪个方向、以何种方式发生变化的统计指标。

用线性回归求得的值,并不是两个数值之间物理上的按比例关系,而是它们之间相关程度。

这就叫做相关系数。

3. 후기

今天的内容实在太简单,就直接快速地学完了。

本来想久违地用 Python 找一找线性回归函数再写下来,结果因为太久没看,发现自己已经记不太清了。

import numpy as np

x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 5, 4, 5])

slope, intercept = np.polyfit(x, y, 1)

print(slope, intercept)

果然学习还是要坚持不懈,经常回顾才行。

댓글을 불러오는 중...