今日は、教師のための教育研究および統計分析研修の第21〜30次で印象に残った内容と感想を残しておこうと思う。
1. logit(ロジット)とロジスティック回帰分析
最初にロジスティック回帰分析と聞いたときは、何かとてつもなく難しいものだと思ったが、実はロジットに沿った線形回帰分析だということが分かった。
以前 LLM を学んだときに出てきた「ロジット」という概念が、まさかここでも出てくるとは思わなかった。
オッズ(odds)は、ある事象が起こる確率を、その事象が起こらない確率で割ったものである。
そしてここに log をかけたものがロジットだ。
このようにロジットを使う理由は、変数の変化量に応じてロジットの増加・減少の倍率が一定になるからである。
ただしロジットのグラフは、そのグラフ自体の意味を解釈するのが容易ではないため、解釈の過程でオッズ、そして確率へと再変換してやる必要がある。
R での使用方法もとても簡単で、これまで使っていた lm 関数の前に g を付けて glm としてあげればよい。
data <- read.csv(file.choose())
m1 <- glm(Y ~ X, data=data, family = binomial)2. Lord のパラドックスとその解釈方法

Lord のパラドックスは、男女二つの集団の体重変化グラフをもとに、分析方法によって解釈が変わってしまうことについての議論である。
同じデータから異なる研究結果が出てくるため、「パラドックス」と呼ばれている。
ある研究者は二つの集団を使って共分散分析(ANCOVA 分析)を行い、別の研究者は最終体重から初期体重を引いた差を用いて分析した。
これは研究質問の段階から違いが生じている。

前者は共分散分析によって「男女が同じ体重からスタートした場合のダイエット効果」について扱ったのに対し、後者は「男女のダイエット後の平均的な体重変化量」について扱ったのである。
結論として、この二つの分析方法は互いに異なる研究質問に答えており、どちらの方法がより妥当かは研究の目的と解釈の観点によって異なる。
これは研究において、研究の目的と方向性に応じて適切な検証方法を選択すべきことを示唆している。
3. 教師のための教育研究および統計分析研修・最終レビュー
最初に研修を申し込んだときは、大学院で受けた研究方法論とそれほど変わらないだろうと思って申し込んだのだが、本当に大いに役立った。
大学院では教育研究の全般を扱っていたとすれば、この遠隔研修は、論文に必要な部分をピンポイントで取り上げ、実践まで細かく見ていったという印象だ。
主に線形回帰に関連する統計分析を扱っていたが、結局、教師が行える統計分析の中で最も有効に活用できるのは線形回帰ではないかと思う。
そして R をなぜ学ぶのかと最初は思っていたが、授業を受けてすぐに R と R Studio をインストールした。
私は R なしでは研究できない。

ただ、残念な点としては、講義資料に csv ファイルがなく、実際に R を用いた統計分析の実習が難しかったことだ。
私は Kaggle からデータを入手して一応やってみたが、こうした分析に慣れていない人にとっては、少しついていきにくい部分もあったかもしれない。

いずれにせよ、研修は良かった。
もし誰かにこの講義を勧めるかと聞かれたら、私は当然 YES と答える。
この研修を一つ受けてから論文を書くと、本当に大きな助けになると思う。
最後に、今年は良い論文が書けるよう祈ってみる。

댓글을 불러오는 중...