心理統計 まとめ -5-
前回の続き
5章「統計的仮設検定ってなんだろう」
統計的仮設検定の考え方
ある仮設の成否(正しいか間違っているか)について統計的に検討する方法
実際の手順
- 仮説を設定する
- 統計的仮設検定に用いられる標本統計量を選択する
- 仮説が間違っているか正しいかの判断基準になる確率を設定する
- 実際のデータから標本統計量の実現値を計算する
- 最初に定めた仮説が間違っているか正しいか判断する
帰無仮説と対立仮説
本来主張したいこととは逆の内容である帰無仮説を設定する。そして、本当に主張したい仮説を対立仮説として定める。帰無仮説の基では実際に得られたデータがとても極端な値であり、そのような値は非常にまれな確率でしか生じないという事が確認された場合、こうした実際のデータの様子から、「帰無仮説が正しい」という前提を疑い、帰無仮説を棄却する。
有意水準
帰無仮説を棄却し対立仮説を採択するかどうか決定するときに、どの程度低い確率の結果が示されたら帰無仮説を棄却するかという基準になるのが有意水準
有意水準は、αで表され、5%か1%で設定されることが多い。
検定結果の報告
検定統計量の実現値が | 帰無仮説の採否 | 論文などでの報告の仕方の例 |
---|---|---|
棄却域に入る | 棄却する | ・ 5%水準で有意である ・ p < .05 |
棄却域に入らない | 採択する(棄却しない) | ・ 有意な差は認められなかった ・ n.s. |
p値
有意確率、限界水準と呼ばれることもある。帰無仮説が正しいという条件のもとで、標本から計算した検定統計量の実現値以上の検定統計量が得られる確率のこと
2種類の誤り
決定 | は正しい | は間違い |
---|---|---|
を棄却 | 第1種の誤り 確率はα |
正しい決定 確率は1 - β ←これを検定力という |
を棄却しない | 正しい決定 確率は 1- α |
第2種の誤り 確率はβ |
検定力:間違っている帰無仮説を正しく棄却できる確率のこと
統計的仮設検定の手順
手順 | やること |
---|---|
1 | 帰無仮説と対立仮説(両側or片側検定)を設定する |
2 | 仮説に応じた検定統計量を選択する |
3 | 有意水準αの値を決める |
4 | (データを収集した後、)データから検定統計量の実現値を決める |
5 | 検定統計量の実現値が棄却域に入れば帰無仮説を棄却して、対立仮説を採択する。棄却域に入らなければ、帰無仮説を採択する |
いろいろな検定
一つの平均値の検定(標準正規分布を用いた検定)
- 検定の目的:一つの標本平均を母平均と比較する(母分散が既知)
- 帰無分布として用いる確率分布:標準正規分布
- 検定統計量:
母分散が既知とはどんな場合か?
例1:ある学力テストの得点について数十年の蓄積があり、その平均や分散が経験的に分かっている場合。
例2: 工場である製品を作っていて、その製品の重さが平均いくらか、分散いくらの正規分布になるように機械が調整されている場合。
一つの平均値の検定(t検定)
- 検定の目的:一つの標本平均を母平均と比較する(母分散が未知)
- 帰無分布として用いる確率分布:t分布(自由度=サンプルサイズ-1)
- 検定統計量:
:普遍分散
t分布の自由度
サンプルサイズ-1となる。
自由度が大きくなる(サンプルサイズが大きくなる)とt分布は標準正規分布に使づいていく。自由度=∞の時にt分布=標準正規分布となる。
サンプルサイズnが大きいときは、t分布ではなく標準正規分布を利用しても、かなり近い結果が得られる。
相関係数の検定
- 検定の目的:2つの量的変数の間に統計的に有意な相関があるかを見る
- 帰無分布として用いる確率分布:t分布(自由度=サンプルサイズ-2)
- 検定統計量:
カイ2乗検定
名義尺度データに対する検定。
- 検定統計量:
:観測度数。実際の名義尺度データでカテゴリがkである場合のそれぞれのカテゴリに属する度数のこと。
:期待度数。帰無仮説のもとで計算される度数のこと。総度数(サンプルサイズ)に帰無仮説の基でカテゴリkの比率を書けることで求められる
※実際の観測度数と期待度数がかけ離れているほど、つまり「現実」と「期待」のズレが大きいほど値は大きな値となる。
適合度の検定
- 検定の目的:観測度数と期待度数がどの程度適合しているか、マッチしているか、をみる
- 帰無分布として用いる確率分布:カイ2乗分布(自由度=カテゴリ数-1)
独立性の検定
- 検定の目的:2つの質的変数の間に統計的に有意な連関があるかを見る。
- 帰無分布として用いる確率分布:カイ2乗分布(自由度=(行数-1) × (列数 - 1) )