今天想记录一下在面向教师的教育研究与统计分析培训第21~30课时中让我印象深刻的内容,以及一些个人心得。
1. logit(对数几率)和逻辑回归分析
一开始听到“逻辑回归分析”这个名字,还以为是什么很了不起的东西,结果发现其实就是沿着对数几率(logit)走的线性回归分析。
没想到之前学 LLM 时出现过的“logit”概念,在这里又见到了。
胜算(odds)是指某件事发生的概率,除以该事件不发生的概率。
然后在此基础上取 log,就是 logit(对数几率)。
之所以使用 logit,是因为在自变量变化时,logit 增加或减少的倍数是恒定的。
不过 logit 曲线本身并不容易直接从图形上进行解释,所以在解读时,需要把它再转换回胜算以及概率来理解。
在 R 中的使用方法也非常简便,只要在原本使用的 lm 函数前面加个 g,改成 glm 就可以了。
data <- read.csv(file.choose())
m1 <- glm(Y ~ X, data=data, family = binomial)2. Lord 的悖论及其解读方法

Lord 的悖论,是围绕男女两组的体重变化曲线展开的一种讨论:根据分析方法的不同,解读结果会出现差异。
因为在使用同一组数据时却会得出不同的研究结果,所以被称为“悖论”。
一位学者使用两组数据进行了协方差分析(ANCOVA 分析),另一位学者则是用最终体重减去初始体重的“差值”来进行分析。
这从研究问题的设定开始就已经出现了差异。

前者通过协方差分析,讨论的是“如果男女在相同体重起点出发时,各自的减肥效果如何”;而后者讨论的则是“男女在减肥后平均体重变化量有多大”。
总的来说,这两种分析方法是在回答不同的研究问题,哪一种更合理,取决于研究的目的和解读的视角。
这提示我们,在进行研究时,必须根据研究的目的和方向,选择恰当的检验方法。
3. 面向教师的教育研究及统计分析培训最终心得
最初报名培训时,只是想着和研究生阶段上过的研究方法论差别不大会,所以就报了,结果收获远超预期。
如果说读研时主要是从整体上学习教育研究,那么这次远程培训则是把论文中需要用到的部分精准拎出来,从实战角度进行了细致讲解。
培训中主要讨论了与线性回归相关的统计分析,想来想去,对教师来说,在自己能做的统计分析里,线性回归恐怕是最实用的一种。
一开始我还在想“为什么还要学 R”,结果上完课立刻就安装了 R 和 R Studio。
现在的感觉是:没有 R 我都没法做研究了。

唯一有点可惜的是,讲义资料里没有附 csv 文件,所以在实际用 R 做统计分析练习时有些困难。
我自己是从 Kaggle 上找了数据来练习了一下,但如果对这类分析不熟悉,可能会有点难以跟上。

总之,这次培训非常好。
如果有人问我推不推荐这门课,我当然会回答 YES。
只听这一门课就去写论文,都会觉得帮助巨大。
最后,只希望自己今年能顺利把论文写好。

댓글을 불러오는 중...