毎回1コマごとに感想を書いていたのだが、指導要録も書いてこれもやっていると、毎晩睡眠時間を削らざるを得なかった。
このままでは体がもたないと思い、まとめて書くことにした。

1. 単回帰モデル - 決定係数
単回帰モデルでは、単に線形回帰の曲線や係数だけではデータの形を把握することはできない。
たとえば、下のようなデータがあるとき、2つのデータの回帰曲線の切片と傾きは同じである。
しかし、2つのデータは異なる。

決定係数は、線形回帰に対するY値の差を二乗して足し合わせたものである。
こうすることで、予測された直線から実際のデータがどれくらい離れているかが分かる。
もし決定係数が0であれば、回帰モデルは従属変数全体の分散の0%も説明していないということであり、1であれば、回帰モデルが従属変数全体の分散の100%を説明しているということになる。
2. 重回帰モデル
重回帰モデルは、従属変数が1つの独立変数だけに依存していないときに用いる。
下図は、事後得点が事前得点と年齢に関係している場合を3次元グラフで表したものである。

ここで重回帰分析を行うと、1つの平面が得られる。
注意すべき点は、これは一方の独立変数を統制したときに、もう一方の独立変数の変化に伴う従属変数の変化を説明している、ということである。
3. 回帰モデルの比較と変数の選択
回帰モデルに変数を追加すればするほど、R値は増加する。
そのため、単純なR値ではなく、修正済みR値などを用いる。
これは、変数が追加されるたびに減点する方式でR値を縮小させるものである。

回帰モデルを選択するとき、どのモデルを選ぶかを、段階的に変数を追加しながら検討することができる。
これを階層的回帰分析という。
変数を追加せず、1つの変数で2次、3次曲線を描いて、変数との関係をより複雑にすることもできる。
4. まとめ(所感)
論文で使う分析方法はものすごく難しいのだと思っていたが、ふたを開けてみると、それほど難しくはなさそうだ。
もともと知っていたやり方なので、むしろ親しみやすく感じる。
しかし、実戦でも果たしてそうだろうか…?
論文をどう書くべきか毎日考えてはいるものの、どんなテーマで深掘りすればよいのか、なかなかピンとこない。
この研修が終わるころには、研究質問を見つけられていたらいいなと思う。
댓글을 불러오는 중...