高校数学[総目次]
数学B 第3章 統計的な推測
| スライド | ノート | 問題 | |
| 1. 確率変数と確率分布 | |||
| 2. 確率変数の期待値と分散 | |||
| 3. 確率変数の変換 | |||
| 4. 確率変数の和と期待値 | |||
| 5. 独立な確率変数と期待値・分散 | |||
| 6. 二項分布 | |||
| 7. 正規分布 | |||
| 8. 母集団と標本 | |||
| 9. 推定 | |||
| 10. 仮説検定 |

9.推定
9.1 母平均の推定
前節までは,母平均や母分散,母標準偏差といった情報がわかっている前提の議論であったが,実際にはそういった統計量は事前にはわかっていないのが普通である.そこで,標本平均から母平均を推定する方法について考える.
母平均 $m$,母標準偏差 $\sigma$ の母集団から無作為抽出された大きさ $n$ の標本の標本平均 $\overline{X}$ は,$n$ が十分大きいときには近似的に正規分布 $N\left(m,\dfrac{\sigma^2}n\right)$ に従うのであった(中心極限定理 ).更にこれを
\[Z=\frac{\overline{X}-m}{\frac\sigma{\sqrt n}}\]
によって標準化すると,確率変数 $Z$ は近似的に標準正規分布 $N(0,1)$ に従う.
正規分布表によれば,標準正規分布に従う確率変数 $Z$ は $P(|Z|\leqq 1.96)\fallingdotseq 0.95$ であるから,$Z$ がこの範囲にあるとき,
\[\begin{align*}
&\hspace{20mm}|Z|\leqq1.96\\[5pt]
\iff&\hspace{15mm}\left|\frac{\overline{X}-m}{\frac\sigma{\sqrt n}}\right|\leqq 1.96\\[5pt]
\iff&-1.96\leqq\frac{\overline{X}-m}{\frac\sigma{\sqrt n}}\leqq 1.96\\[5pt]
\iff&\overline{X}-1.96\cdot\frac\sigma{\sqrt n}\leqq m \leqq\overline{X}+1.96\cdot\frac\sigma{\sqrt n}
\end{align*}\]
つまり,
\[P\left(\overline{X}-1.96\cdot\frac\sigma{\sqrt n}\leqq m \leqq\overline{X}+1.96\cdot\frac\sigma{\sqrt n}\right)=0.95 \]
である.従ってこの計算された範囲
\[\overline{X}-1.96\cdot\dfrac\sigma{\sqrt n}\leqq x \leqq\overline{X}+1.96\cdot\dfrac\sigma{\sqrt n}\]
に母平均 $m$ が含まれていることが約95%の確からしさで期待できる.
この区間を母平均 $m$ に対する信頼度95% の信頼区間という.
信頼区間は [ ] を用いて次のように表される.
\[\left[\overline{X}-1.96\cdot\frac\sigma{\sqrt n},\ \overline{X}+1.96\cdot\frac\sigma{\sqrt n}\right]\]
母平均の推定 標本の大きさ $n$ が大きいとき,母平均に対する信頼度95%の信頼区間は,標本平均を $\overline{X}$,標本標準偏差を $S$ とすると \[\left[\overline{X}-1.96\cdot\frac \sigma{\sqrt n},\ \overline{X}+1.96\cdot\frac \sigma{\sqrt n}\right]\]
信頼度95% の信頼区間を求めることを「母平均 $m$ を信頼度95% で推定する」という.
補足
上の式から母平均を信頼度95%で推定するためには
①標本平均 $\overline{X}$ ②母標準偏差 $\sigma$ ③標本の大きさ $n$
の3つの情報が必要であるが,②の母標準偏差だけは事前にわかっていないのが普通である.標本の大きさ $n$ が大きいときは標本標準偏差
\[S=\sqrt{\frac1n\sum_{k=1}^n(X_k-\overline{X})^2}\]
の値を用いてもよい.
例題 ある製品を100個無作為抽出し,長さを測定したところ,平均値42.1cm,標準偏差1.0cmとなった.この製品の平均の長さに対する信頼度95%の信頼区間を求めよ.
解答例を表示する
標本平均が42.1,標準偏差が1.0,標本の大きさが100であるから,
\[1.96\times\frac{1.0}{\sqrt{100}}=0.196\fallingdotseq0.2\]
よって求める信頼区間は
\[[42.1-0.2,\ 42.1+0.2]\]
\[\therefore [41.9,\ 42.3]\]
ただし,単位はcmである.
「信頼度95%の信頼区間」の意味
すぐ上の例題では,信頼度95%の信頼区間として $[41.9,\ 42.3]$ を得たが,母平均 $m$ (定数!)はこの区間に入っているか入っていないかのどちらかでしかない.今回たまたま選ばれた100の無作為標本から得た $\overline{X}$ を用いて計算した結果が区間 $[41.9,\ 42.3]$ であって,無作為抽出をやり直してもう一度計算すると,今度はまた別の区間が得られるであろう.
