確率変数、確率分布とはなんぞや!?

統計学
この記事は約5分で読めます。

ナバ
ナバ

この記事では確率変数確率分布について説明します。

確率変数

確率変数とは、起こりうる事象に割り当てている値を取る変数です。
そして各事象は、確率を持ちます。

話を分かりやすくするために、サイコロの例を使って説明します。

6目のサイコロの場合、起こりうる事象は、「1が出る」、「2が出る」…「6が出る」であり、各目を取る確率はそれぞれ1/6です。

よって、各目(1,2,3,4,5,6)が確率変数になります。

確率変数をXとおくと、サイコロの各目が出る確率を以下のように表すことができます。

P(X)をXの確率関数と言います。

確率変数は必ず数値をとります。

サイコロの場合、起こりうる事象(各目)が数値なので、事象をそのまま確率変数に使えました。

起こりうる事象の表現が数値以外の場合、例えばコイン投げについても確率変数を考えることができます。

コイン投げの場合、表が出る事象を1、裏が出る事象を0とおくことで、各事象を確率変数で扱えるようになります。

確率分布

確率変数の各値に対応する確率の変動を表したものが確率分布です

サイコロ投げとコイン投げの確率分布は以下のように表現できます。

確率変数には、離散型連続型に分かれます。

離散型は、値がとびとびの変数で、サイコロ投げやコイン投げの確率変数は離散型になります。

一方、連続型は、値をいくらでも細かく刻むことが可能な変数で、身長や体重などの確率変数が連続型に該当します。

離散型確率変数Xがある1点の値xを取る確率P(X=x)をf(x)とおいたとき、f(x)を確率質量関数といいます。

確率の取りうる範囲は、0以上1以下ですから、取りうるすべてのf(x)を足し合わせると、1になります。

一方、連続型確率変数Xがある1点の値xを取る確率は、0になってしまいます

0になるのは、連続型確率変数は、値を無限に細かく刻める性質が関係しています。

取りうる値に対応する確率を足し合わせると「1」になることは、すでに説明済みです。

離散型の場合、例えば6目サイコロを振って 3が出る確率P(X=3)は、
「1」÷「取りうる値の個数6」=1/6 という計算で求めました 。

しかし、連続型の場合はどうでしょうか。

取りうる値が無限にあるので、ある1点の確率は下記のとおり0になってしまいます。

この問題を解決するために、連続型確率変数においては「ある1点」ではなく「ある区間」に入る確率を考えます。

確率変数Xがある小さい区間(x, x+Δx)に入る確率

幅Δxを極限まで小さくしたときに、区間(x, x+Δx) に入る確率をf(x)とおきます。

f(x)を確率密度関数と呼びます。

ある区間(a, b)に入る確率は、確率密度関数f(x)を区間(a, b) で積分することにより求まります。

ナバ
ナバ

「関数f(x)を積分する」=「関数f(x)より下側の面積を求める」

連続型の確率分布である「正規分布」に関しては、下記で解説していますので、是非こちらもあわせてお読みください。

まとめ

確率変数とは、起こりうる事象に割り当てている値を取る変数です。

確率分布は確率変数の各値に対応する確率の変動を表したものです。

・確率変数には「離散型」と「連続型」があり、連続型変数の確率分布を表すのに使われるのが確率密度関数です。

参考書籍

確率について、もっと詳しく知りたい方には、下記の書籍がおすすめです。

コメント

タイトルとURLをコピーしました