以下の情報がわかっている(いくつかは必要に応じて適宜決める)とき,必要な標本サイズnを求めることができる. given: confidence level c, margin of Error E, population variance , まず,上側確率がaとなる点をと定義する.これの詳しい説明は以下に書いてます.

この定義は,以下を意味する.

$$ \displaystyle P(X > Z_{a}) = a $$

こう定義しておくと,以下の事実を得る.

$$ \displaystyle P(|X| < Z_{a}) = 1-2a $$

問題は,標本平均と母平均との絶対値差がE以下である確率をc以上になるよう保証する標本サイズnを求めなさいということなので,

$$ \displaystyle P(|\bar{X} - \mu| < E) \geq c $$

ちなみに,より,を得る. ここで,

$$ \displaystyle Y = \frac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}} $$

と,標準化を施すと(この標準化はずーっと元をたどると,誤差がに従うとこから来てます.これについてはまた書きます,多分),

$$ \displaystyle P(|Y| < \frac{\sqrt{n}}{\sigma} E) \geq c $$

を得る.よって,

$$ \displaystyle n \geq \frac{Z^{2}_{a} \sigma^{2}}{E^{2}} $$

を得る. 問題があるとわかりやすいので,以下のサイトの問題を使う.

問題:, がわかっている時,を達成する標本サイズnを求めよ.
このサイトでは,1-c=aとして説明している.僕が書いたaとは違います,混乱するかもしれませんね. よし,Rで求めてみよう.

> E = 1.2
> c = 0.95
> a = (1-c) / 2
> Za = qnorm(1-a) #前記事参照のこと
> n = Za^2 * sigma^2 / E^2
> n
[1] 239.7454

よって,母分散が9.48のとき,E=1.2, c=0.95を達成には標本サイズを240以上にしなければならない.