手元にあるデータを解析するとき、真っ先に平均値や標準偏差を計算すると思いますが、平均値は単なる点推定であるため母集団の平均値を求めることはできません。
ここで、母集団の平均値を知ろうと思ったときに使えるのが区間推定になります。
目次
区間推定とは
区間推定とは、ある母集団が正規分布に従うとき、標本の値を使って特定の区間での母集団の平均を推定することです。
例えば、手元にサンプル10個のデータがあったとします。これをもとにして、10000個のサンプルの平均値を求めることは不可能ですが、区間推定を利用すると「母集団の平均値は少なくともこの区間(信頼区間)にあるだろう」ということができるようになります。
正規化
母集団が正規分布に従うとき、標本の分散および平均がわかっていれば、以下のZ分布に正規化できます。
$$Z=\frac{X-\mu}{\sigma}$$
不偏分散をSとし、この式を標本平均と母平均について書き換えると
$$T=\frac{\sqrt{n}(\bar{X}-\mu)}{S}$$
で表されるt分布を得ます。
