今天学习了关于总体和样本的内容。
明天有皮革工艺课,所以非常忙,但多亏了妻子帮忙让孩子们早点睡,我还是学习了1小时。
觉得自己需要更努力地学习。
1. 总体 vs 样本

理解总体和样本之间的差异,对研究结果的效度非常重要。
假设有研究者提出了以下主张。
对就读于京畿道的初中生而言,吃早饭并不能帮助提高成绩。这位研究者想表达的是,对所有初中生,或者至少对京畿道的初中生来说,吃早饭对成绩提升没有帮助。
然而在实际研究中,相对于全部初中生,被选中的初中生数量只是很小一部分。
这里就产生了一个重要的概念性差异。
研究者想讨论的是对全部学生而言早餐的效果,但实际分析的只是其中的一部分。
在这里,基于被选中初中生的数据,将结论扩展到全部初中生,就要用到统计推断。
2. 样本的代表性与随机抽样
为了让被抽样(sampling)的样本能够代表总体,需要什么条件呢?
如果选中的初中生在家庭收入、性别等方面存在偏倚,那么基于此得出的推论结论还具有效度吗?
如果样本不能代表总体,两者之间存在较大差异,那么通过研究形成的推论就是无效的。

关键在于如何进行抽样。
采用随机抽样(무선추출,random sampling)时,总体的特征能够被较为均匀地反映出来。
但即使随机抽样做得很好,从样本得出的结论也未必与总体的真实结果完全一致。
在样本中,为应对偶然性(非系统性偏差)而进行的统计处理努力,就称为统计显著性。
3. 对统计显著性的理解
假设从总体中抽取多个样本。
在总体中,早餐并没有效果。
在样本中,分析得到的数值可能会因为偶然性而不同。

在这样抽取多个样本后,把各个样本的估计值都汇集起来,那么出现比中间值 0.358 更大的值的概率,就是显著性概率(p-value)。
论文中会证明:在“早餐没有效果”这一前提下,在随机抽取的样本中偶然观察到 0.358 这一效果值的概率小于 0.001。
因此,可以认为在总体中几乎不可能得到 0.358 这样的数值,从而证明总体上是没有效果的。
4. 后记
在论文写作中,逻辑上的有效性似乎非常重要。
某种意义上,细致而执着地深挖问题的人,也许就是适合写论文的人。
需要不断把自己的思考切分得很细,并且不停检查这些想法之间搭起的桥梁是否指向正确的方向。
该着手规划论文了,感觉需要思考的问题在不断增加。
댓글을 불러오는 중...