
この記事では、以下を紹介します!
・二項分布とポアソン分布の関係
・ポアソン分布の利用した在庫設定
・一定期間内に事象が何回発生するかを表す確率分布
・二項分布の試行回数nが非常に大きく、生起確率pが非常に小さい場合に近似できる確率分布
二項分布を他の分布に近似するパターンは一般的に以下の2つです。
・正規分布に近似する
・ポアソン分布に近似する
二項分布とポアソン分布の関係
二項分布とは、生起確率pのベルヌーイ試行をn回行ったときの発生回数Xが従う確率分布です。
確率変数Xが二項分布に従う場合、生起確率pの試行をn回行ったときにk回発生する確率は、次の式で計算できます。

そして二項分布は、試行回数nが大きいときは正規分布に近似できる性質を持っています。
例として、コインをn回投げて表が出る回数の確率を考えます。
コインの表が出る確率pは0.5です。
下のグラフは、pを0.5に固定し、試行回数nを増やしたときの分布の変化を示しています。

0.5のように、生起確率pがある程度高い場合はnが大きくなるにつれて正規分布に近づいていることがわかります。
では、生起確率pが非常に小さい場合はどうでしょうか。
100回投げて表が1回しか出ない不思議なコインがあったとします。
つまり、生起確率pは0.01です。
下のグラフは、生起確率pを0.01に固定して試行回数nを増やしたときの分布の変化を示しています。

生起確率pが非常に小さい場合の近似を考えるときは、正規分布よりもポアソン分布の方が適しています。
二項分布の試行回数nが非常に大きく、生起確率pが非常に小さい場合はポアソン分布に近似できます。
この近似は、「試行回数n、生起確率pの二項分布B(n,p)において、λ=npを一定にしたままn→∞にするとpは限りなく小さくなる性質」を利用しています。
下のグラフは二項分布のnp=2を一定にしたままnを大きく、pを小さくしていったときに、二項分布がポアソン分布に近づく様子を示しています。

二項分布B(n,p)がポアソン分布で近似できるための一般的条件は、以下とされています。
n > 50, np ≦ 5
ポアソン分布
ポアソン分布とは、ある期間に平均λ回発生する事象がk回起こる確率を表す分布です。
そして、ポアソン分布の平均と分散はそれぞれλに一致する性質を持っています。
確率変数Xがポアソン分布に従う場合、一定期間内に平均λ回起こる事象がk回発生する確率は次の式から計算できます。

ここで、注目すべきはパラメータの数です。
二項分布の確率関数のパラメータ数は試行回数nと生起確率pの2個だったのに対し、ポアソン分布の場合は平均回数λの1個だけです。
ポアソン分布の素晴らしいところは、試行回数nが分からなくても、一定期間内の平均回数λさえ決まれば、確率を求めることができる点です。
例題:ポアソン分布を使った在庫設定
次の2つの例題でポアソン分布を利用した確率の計算を実践してみましょう。
あるメーカーでは、ある製品の修理用部品Aの在庫を管理している。
修理部品Aが必要な修理依頼が発生する件数は、1か月あたりの平均が2件であることから、月間在庫数を2に設定しています。
翌月に3件以上の修理依頼が発生する確率を求めよ。
一定期間を1か月とした場合、平均回数λ=2です。
事象が3回以上発生する確率は、1-(0~2回の累積確率) で求めることができます。
0~2回のそれぞれの発生確率は、次の式にk=0,1,2、λ=2を代入して計算できます。

0回:0.1353353
1回:0.2706706
2回:0.2706706
0~2回の累積確率は上記3つの発生確率を足し合わせた値です。
累積確率を計算すると、0.6766764となります。
ちなみに統計解析ソフトRを使用すれば、累積確率を簡単に計算することができます。
下記は、0~2回の累積確率を計算するRスクリプトです。
> ppois(2,2) [1] 0.6766764
したがって、事象が3回以上発生する確率は次の式で計算できます。
(3回以上発生する確率) = 1 ー (0~2回の累積確率) =1ー 0.6766764 =0.3233236
よって、 翌月に3件以上の修理依頼が発生する確率は、約32%となります。
この計算結果から、在庫数と2とした場合、翌月に在庫切れにならない確率は約68%であると考えられます。
あるメーカーでは、ある製品の修理用部品Aの在庫を管理している。
修理部品Aが必要な修理依頼が発生する件数は、1か月あたりの平均が2件であることから、月間在庫数を2に設定しています。
1か月間に在庫切れにならない確率を95%としたい場合、在庫をいくつ抱えておけばよいか。
※在庫数を考える場合は部品の調達リードタイム等を考慮する必要があるが、この問題では無視してよい。
例題1と同様に、0~k回の累積確率を求め、累積確率が95%を超えるkを求めます。
下記Rスクリプトで、k=3~5の累積確率を計算すると、k=5で累積確率が95%を超えているのがわかります。
> ppois(3,2)#k=3,λ=2 [1] 0.8571235 > ppois(4,2)#k=4,λ=2 [1] 0.947347 > ppois(5,2)#k=5,λ=2 [1] 0.9834364
よって、 1か月間に在庫切れにならない確率を95%としたい場合、在庫を5個抱えておけばよい。
ちなみに、Rの関数qpois()を使用すれば、引数に指定した累積確率に対応する確率変数の値が返ってきます。
> qpois(0.95, 2) [1] 5
参考までに、下図は累積確率95%を示した確率分布(左)と累積確率グラフ(右)です。

まとめ
・ポアソン分布とは、ある期間に平均λ回発生する事象がk回起こる確率を表す分布です。
・np=λが一定で、試行回数nが非常に大きく、生起確率pが非常に小さいとき、二項分布B(n,p)は平均λのポアソン分布に近似できます。
・ポアソン分布の素晴らしいところは、試行回数nが分からなくても、ある期間内の平均回数λさえ決まれば、確率を求めることができる点です。
参考書籍
確率分布を0から理解したいなら、下記の書籍がわかりやすいのでオススメです!
コメント