二項分布(Binominal)とは 【pythonで学ぶ統計学】

理系で大学入学して、研究室で活動までしているにもかかわらず、統計に関する知識が全くないことに焦りを覚えて一から勉強して行っています。統計がわからないと言いながら、いきなりベイズ推定を使ってどうにかこうにかしようとしてたのがアホらしいです。

思いつきで【pythonで学ぶ統計学】というジャンルを作ってしまったので、これからpythonを使いながら統計を学んでいこうと思います。(統計といえばRですが、これまでpythonばかり使ってきたのであんまり使いたくないというのが本音です。）

二項分布とは

二項分布とは、ベルヌーイ試行における確率分布です。

ベルヌーイ試行とは

ある試行に対して結果が2種類のみ存在する時、その試行をベルヌーイ試行と呼ぶ。

例えば、ある試行が成功する確率をp、成功しない確率(失敗する確率)をqとすれば、ベルヌーイ試行では

$$p = 1-q$$

という式が成り立ちます。

“確率質量関数とは”

確率変数が離散的な値を取る場合（例えばサイコロの目やコインの裏表など）に、特定の事象が起こる確率Pのこと。

ここで、確率変数をX,確率変数がaとなる時、その確率Pは確率質量関数を用いて

$$P(X=a)=f(a)$$

と表すことができます。

確率密度関数と確率質量関数【Pythonで学ぶ統計】

二項分布は母数を試行回数n,成功回数kとして、以下のような式で表すことができます。

$$P(X=k)=(\begin{matrix}n\\k\end{matrix})p^k(1-p)^{n-k}$$

また、期待値及び分散は

$$E(x)=np,V(x)=np(1-p)$$

となります。

ド・モアブル・ラプラスの定理より、二項分布において試行回数nが十分大きいとき、平均np,分散np(1-p)の正規分布に近づくことがわかっています。