高校数学ノート[総目次]
数学B 第3章 統計的な推測
スライド | ノート | |
1. 確率変数と確率分布 | ||
2. 確率変数の期待値と分散 | ||
3. 確率変数の変換 | ||
4. 確率変数の和と期待値 | ||
5. 独立な確率変数と期待値・分散 | ||
6. 二項分布 | ||
7. 正規分布 | ||
8. 母集団と標本 | ||
9. 推定 | ||
10. 仮説検定 |
9.推定
9.1 母平均の推定
前節までは,母平均や母分散,母標準偏差といった情報がわかっている前提の議論であったが,実際にはそういった統計量は事前にはわかっていないのが普通である.そこで,標本平均から母平均を推定する方法について考える.
母平均 $m$,母標準偏差 $\sigma$ の母集団から無作為抽出された大きさ $n$ の標本の標本平均 $\overline{X}$ は,$n$ が十分大きいときには近似的に正規分布 $N\left(m,\dfrac{\sigma^2}n\right)$ に従うのであった(中心極限定理).更にこれを
\[Z=\frac{\overline{X}-m}{\frac\sigma{\sqrt n}}\]
によって標準化すると,確率変数 $Z$ は近似的に標準正規分布 $N(0,1)$ に従う.
正規分布表によれば,標準正規分布に従う確率変数 $X$ は $P(|X|\leqq 1.96)\fallingdotseq 0.95$ であるから,$Z$ がこの範囲にあるとき,
\[\begin{align*} &\hspace{20mm}|Z|\leqq1.96\\[5pt] \iff&\hspace{15mm}\left|\frac{\overline{X}-m}{\frac\sigma{\sqrt n}}\right|\leqq 1.96\\[5pt] \iff&-1.96\leqq\frac{\overline{X}-m}{\frac\sigma{\sqrt n}}\leqq 1.96\\[5pt] \iff&\overline{X}-1.96\cdot\frac\sigma{\sqrt n}\leqq m \leqq\overline{X}+1.96\cdot\frac\sigma{\sqrt n} \end{align*}\]
つまり,
区間 $\overline{X}-1.96\cdot\dfrac\sigma{\sqrt n}\leqq x \leqq\overline{X}+1.96\cdot\dfrac\sigma{\sqrt n}$
に確率0.95 で母平均が含まれることがわかる.
この区間を母平均 $m$ に対する信頼度95% の信頼区間という.
信頼区間は [ ] を用いて次のように表される.
\[\left[\overline{X}-1.96\cdot\frac\sigma{\sqrt n},\ \overline{X}+1.96\cdot\frac\sigma{\sqrt n}\right]\]
補足
信頼度95% の信頼区間を求めることを「母平均 $m$ を信頼度95% で推定する」という.
例題 ある製品を100個無作為抽出し,長さを測定したところ,平均値42.1cm,標準偏差1.0cmとなった.この製品の平均の長さに対する信頼度95%の信頼区間を求めよ.
答
標本平均が42.1,標準偏差が1.0,標本の大きさが100であるから,
\[1.96\times\frac{1.0}{\sqrt{100}}=0.196\fallingdotseq0.2\]
よって求める信頼区間は
\[[42.1-0.2,\ 42.1+0.2]\]
\[\therefore [41.9,\ 42.3]\]
ただし,単位はcmである.
9.2 母比率の推定
ある母集団において,ある特性をもつ母比率が $p$ であるとする.このとき,大きさ $n$ の無作為標本において,その特性をもつ標本比率 $R$ は, $n$ が十分大きいとき近似的に正規分布 $N\left(p,\dfrac{p(1-p)}n\right)$ に従う.
よって,母比率 $p$ は確率0.95で
区間$\left[R-1.96\cdot\sqrt{\dfrac{p(1-p)}n},\ R+1.96\cdot\sqrt{\dfrac{p(1-p)}n}\ \right]$
に含まれる.
$n$ が十分大きいとき,大数の法則により標本比率 $R$ は母比率 $p$ に近い値だと考えられるから,先の区間における根号の中の $p$ を $R$ に置き換えることができる.すなわち次が成り立つ.
母比率の信頼区間 標本の大きさ $n$ が大きいとき,ある特性をもつ標本比率を $R$ とすると,母比率 $p$ に対する信頼度95% の信頼区間は \[\left[R-1.96\cdot\sqrt{\frac{R(1-R)}n},\ R+1.96\cdot\sqrt{\frac{R(1-R)}n}\ \right]\]
例題 あるりんご農園で無作為に抽出した400個について,糖度が基準値未満である個数を調べたところ,40個であった.このりんご農園のりんごの糖度が基準値未満である割合を,信頼度95%で推定せよ.
答
標本比率は $\dfrac{40}{400}=0.1$.よって,
\[1.96\times\sqrt{\frac{0.1\times0.9}{400}}=0.0294\fallingdotseq0.03\]
従って求める信頼区間は
\[[0.1-0.03,\ 0.1+0.03]\]
\[\therefore [0.07,\ 0.13]\]
高校数学ノート[総目次]
数学B 第3章 統計的な推測
スライド | ノート | |
1. 確率変数と確率分布 | ||
2. 確率変数の期待値と分散 | ||
3. 確率変数の変換 | ||
4. 確率変数の和と期待値 | ||
5. 独立な確率変数と期待値・分散 | ||
6. 二項分布 | ||
7. 正規分布 | ||
8. 母集団と標本 | ||
9. 推定 | ||
10. 仮説検定 |