교사를 위한 교육연구 및 통계분석 연수 - 5차시 모집단과 표본

힘센캥거루
2025년 12월 22일(수정됨)
2
challenge

오늘은 모집단과 표본에 대해 배웠다.

내일 가죽공예 수업이 있어서 무척 바빴지만, 아이들을 일찍 재워준 와이프 덕분에 1시간을 공부했다.

더 열심히 공부해야 겠다는 생각이 든다.

1. 모집단 vs 표본

교사를 위한 교육연구 및 통계분석 연수 - 5차시 모집단과 표본-1

모집단과 표본의 차이를 이해하는 것은 연구 결과의 타당성을 위해 무척 중요하다.

아래의 연구자의 주장이 있다고 해보자.

경기도에 재학 중인 중학생에게 아침식사는 성적향상에 도움이 되지 않는다.

이 연구자가 말하고 싶은 것은 모든 중학생들에게, 혹은 경기도의 중학생들에게 아침식사는 성적향상에 도움이 되지 않는다는 것이다.

하지만 실제 연구에서 전체 중학생에 비해 선택된 중학생의 크기는 적다.

여기서 중요한 개념적 차이가 발생한다.

연구자는 전체 학생에 있어서 아침 식사의 효과를 말하고 싶지만, 실제로 분석한 것은 그 중의 일부이다.

여기서 선택된 중학생에 대한 자료를 바탕으로 전체 중학생에 대한 이야기로 확대하는 통계적 추론을 이용하게 된다.

2. 표본의 대표성과 무선추출

샘플링(sampling) 된 표본이 모집단을 대표하려면 무엇이 필요할까?

선택된 중학생이 가정소득, 성별 등이 편향적이라면, 이걸 바탕으로 추론한 결론이 타당할까?

만일 표본이 모집단을 대표하지 못하고 큰 차이가 존재한다면, 연구를 통해 만들어진 추론이 타당하지 않다.

교사를 위한 교육연구 및 통계분석 연수 - 5차시 모집단과 표본-2

핵심은 샘플링을 어떻게 하느냐이다.

램던 샘플링(무선추출)로 하면 모집단의 특성이 골고루 반영된다.

하지만 무선 추출을 잘 이루어져도 표본에서 내린 결론이 모집단의 결과와 일치하지 않는다.

표본에서 우연성(비체계적인 편향)을 통계적으로 다루려는 노력을 통계적 유의성이라고 한다.

3. 통계적 유의성의 이해

모집단에서 여러개의 표본을 뽑아낸다고 해보자.

모집단에서는 아침식사의 효과가 없다.

표본에서는 우연히 분석의 값이 다를 수 있다.

교사를 위한 교육연구 및 통계분석 연수 - 5차시 모집단과 표본-3

이런 표본 추출 후 샘플의 추정치들을 모두 모으면, 중간의 0.358보다 더 큰 값이 나올수 있을 확률을 유의 확률(p-value)이다.

논문에서는 아침 식사의 효과가 없을 것이다라는 전제로 무선추출된 표본에서 0.358이라는 효과가 우연히 관찰될 확률이 0.001보다 작다는걸 증명한다.

따라서 모집단에서는 0.358이라는 값이 나올 수 없으므로, 모집단에서 효과가 없음을 증명한다.

4. 후기

논문에서는 논리적 타당성이 무척 중요한 것 같다.

어찌보면 꼼꼼하고 집요하게 파고드는 사람이 논문을 쓰기 좋은 사람이 아닐까 생각이 든다.

생각을 잘게 쪼개고, 그 생각과 생각 사이에 놓인 다리가 올바른 방향인지를 끊임없이 점검해야 하지 않을까 싶다.

논문을 계획해야 하는데, 고민해야 할 것들이 점점 늘어나는 것 같다.

댓글을 불러오는 중...