高校数学[総目次]

数学B 第3章 統計的な推測

  スライド ノート 問題
1. 確率変数と確率分布      
2. 確率変数の期待値と分散      
3. 確率変数の変換      
4. 確率変数の和と期待値      
5. 独立な確率変数と期待値・分散      
6. 二項分布      
7. 正規分布      
8. 母集団と標本      
9. 推定      
10. 仮説検定      

10.仮説検定

10.1 仮説検定の手順

 「数学Ⅰ データの分析 5. 仮説検定の考え方 」で仮説検定の考え方の基礎は学んだ.ここでは確率分布を用いて確率を計算するタイプを学んでいく.

 硬貨を100回投げたところ,表の面が62回出た.この硬貨は表と裏の出方に偏りがあると判断してよいか.

仮説検定の手順
① 主張を否定する仮定を立てる.
② ①での仮定が正しいものとして,観測された出来事が起こりにくいかどうかを調べる.
③ ②で起こりにくいと判断されれば,その元となった①での仮定が正しくないとする.
④ ③のとき,元の主張は正しいと判断してよい.

説明

 通常100回投げれば表と裏は50回程度ずつで出ると期待されるはずなのに実際には62回も表が出たものだから「この硬貨は作りが怪しいのでは?」ということになった.そこで「表と裏の出方に偏りがある」という主張をしたいので,これを否定する仮説(仮定),すなわち「表と裏の出方に偏りがない」という仮説をまずは立てる.

用語
 帰無仮説
 主張を否定する仮定.
  ここでは「表と裏の出方に偏りがない」
  これを「無に帰したい」訳である.
 対立仮説
 主張したい事柄
  ここでは「表と裏の出方に偏りがある」

「表と裏の出方に偏りがない」すなわち表と裏が等確率で出るという仮定から,表の面が出る確率 $p$ を 0.5 とする.そして $p=0.5$ の仮定のもとでは観測された出来事が起こりにくいという結論を下したいのだが,「起こりにくい」の基準を例えば確率 0.05 としておく.この起こりにくさの基準となる確率は検定を行う前に設定しておかなければならない.観測された事象がこの確率以下ならば,起こりにくいと判断するのである.

 表の面が出る回数を $X$ とすると,$X$ は二項分布 $B(100,0.5)$ に従う確率変数であり,

  期待値$=100\cdot0.5=50$,
  標準偏差$=\sqrt{100\cdot0.5(1-0.5)}=5$

であるから,

\[Z=\frac{X-50}5\]

で定める確率変数 $Z$ は近似的に標準正規分布 $N(0,1)$ に従う.

 正規分布表によれば

\[P(-1.96\leqq Z\leqq 1.96)\fallingdotseq0.95\]

であるから,

$Z\leqq -1.96,\ 1.96\leqq Z\ \ \cdots\ (*)$

であれば,確率0.05以下の滅多に起こらない事柄だということになる.そこで今回観測された結果から $Z$ を計算してみると,$X=62$ であるから

\[Z=\frac{62-50}5=2.4\]

となり,$(*)$ の範囲に入ってくる.つまり表と裏の出方が等確率であるという仮説(仮定)のもとで100回投げて62回表の面が出るというのは確率0.05以下の起こりにくい事柄であると判断する.

用語
 有意水準
 起こりにくさの基準となる確率.危険率ともいう.
 ここでは0.05(すなわち5%).
 棄却域
 起こりにくいと判定される確率変数の範囲.
 ここでは $Z$ について $Z\leqq -1.96,\ 1.96\leqq Z$
 これを「有意水準5%の $Z$ の棄却域」という.

 ②で起こりにくいと判断されたから,帰無仮説「表と裏の出方に偏りがない」が否定される.

用語
棄却
 仮説が正しくないと判断すること.
 ここでは帰無仮説「表と裏の出方に偏りがない」が棄却された.

 帰無仮説が棄却されたので,対立仮説「表と裏の出方に偏りがある」が採択される.

注意

 手順③で,帰無仮説のもとで,観測された出来事が起こりにくいと判断できないとき,換言すれば観測された出来事が起こることもあり得ると判断されたとき,その元となった帰無仮説の正しさが証明された訳ではない.観測された結果が帰無仮説と矛盾しなかったということがいえるだけである.詳しくはデータの分析5.仮説検定の考え方 参照.

コラム 検定結果は正しいか?

 上の硬貨100回投げの例では,表と裏が等確率で出るという仮定(帰無仮説)をおいて観測された結果が起こる確率を計算し,それが起こりにくいと判断されて帰無仮説が否定された.つまり仮説検定が導いた結論は「硬貨は表と裏の出方は等確率ではない」である.

 これは正しい結論だろうか?