カテゴリー: 大学数学数学・統計学

意味が分かる測度論的確率論(2)~確率変数

前回の記事では、確率空間$(\Omega,\mathcal{F},P)$の定義と意味を紹介しました。そこでは、「事象」というのは、$\Omega$の部分集合として表すことができ、その中で確率を測ることができるものを$\mathcal{F}$に入れるのでした。また、$\mathcal{F}$や$P$が完全加法性と呼ばれる性質を満たさなければならないことも述べました。

今回の記事では、そのことをふまえ、確率変数を定義したいと思います。

確率変数とは?

「確率変数」とは、高校では例えば「起こった事象に応じて定まる変数」のような形で習うと思うます。例えば、サイコロを1回ふったとき、出た目をを4で割った余り$X$とします。すると、例えば出た目が2ならば$X=2$となり、出た目が5ならば$X=1$となるように、出た目に応じて$X$の値は変化します。また、$X=1$となる確率は$\frac{1}{3}$、$X=3$となる確率は$\frac{1}{6}$のように、$X$が各値を取る確率を計算することができます。

今の話を総合すると、確率変数とは

  1. 起こった事象に応じて値が定まる
  2. 確率変数が各値を取る確率が計算できる

という条件を満たしている必要がありそうです。それぞれをもう少し深堀してみましょう。

実は最初の「事象に応じて定まる」という表現は実は正しくありません。例えば上の例の場合、「奇数の目が出るという事象」に対しては$X$の値は一つに定まりません(1の目が出たときは$X=1$ですし、3の目が出れば$X=3$です)。むしろ、「1の目が出る」といった「根源事象=それ以上分割できない事象」に対応して、値が定まっているというほうが正しいです。

確率空間$(\Omega,\mathcal{F},P)$で考えると、「根源事象」をすべて集めた集合は、標本空間$\Omega$になりますので、先ほどの条件1は、

確率変数は、定義域が標本空間$\Omega$の関数である。

ということができます。
先ほどのサイコロの例では、1の目が出ることを①などと書くことにすると、標本空間は$\Omega=${①,②,③,④,⑤,⑥}となり、確率変数$X$は

 X(①)=1,X(②)=2,X(③)=3,X(④)=4,X(⑤)=1,X(⑥)=2

という関数になっています。

次に、先ほどの条件2「確率変数が各値を取る確率が計算できる」について考えてみましょう。先ほどの例で、例えば$X=1$になる確率は、
「X=1になるのは、1または5が出るときなので、確率1/3」
と計算できます。

これを確率空間の話で見てみると、
「$X(\omega)=1$となる$\omega$は、①と⑤である。」
       ↓
「$X=1$という事象は、{①,⑤}(1または5の目が出る)という事象と同じである。」
       ↓
「P({①,⑤})=1/3なので、$X=1$となる確率は1/3
という計算を行っていることになります。
これはつまり、

  • $X=1$という事象は、$\{\omega \in \Omega | X(\omega)=1\}$ ($X(\omega)=1$となる$\omega \in \Omega$の集合) に対応する。
  • $X=1$となる確率は、$P(\{\omega \in \Omega | X(\omega)=1\})$に対応する。

ということができます。このことから、$X=1$となる確率が計算できたのは、$\{\omega \in \Omega | X(\omega)=1\}$という事象の確率が計算できたことに由来していることがわかります。

※ なお、$\{\omega \in \Omega | X(\omega)=1\}$という集合は、よく$\{X=1\}$などと省略して書いたりします。しかし、慣れていないうちはこのような書き方をしてしまうと、どのような集合を意味しているのか意識するのが難しいと思いますので、この記事では省略せずに書きたいと思います。


さて、前回の記事に書いたように、一般の確率空間$(\Omega,\mathcal{F},P)$では、すべての事象(=$\Omega$の部分集合)の確率が計算できるとは限りません。確率が計算できる事象たちをすべて集めたのが、$\mathcal{F}$という集合だったのでした。
従って、
$X=a$となる確率が計算できる」
ということは、
「$\{\omega \in \Omega | X(\omega)=a\}$が$\mathcal{F}$に入っている」
ということと同じです。

これをもって確率変数の定義とすればよいでしょうか?しかし、これだけでは例えば「$X=1$となる確率」は計算できても、例えば、「$X$が1以上となる確率」などは計算できないかもしれません。もっと言うと、すべての実数$a$に対して、

  • $X=a$となる確率
  • $X>a$となる確率
  • $X\geq a$となる確率
  • $X< a$となる確率
  • $X\leq a$となる確率

はすべて計算できてほしいわけです。そこでこれらの確率がすべて計算できることを確率変数の定義としても良いのですが、実は、確率空間の定義から、すべての実数$a$に対して、

  • $X>a$となる確率

が計算できれば、残りも計算できてしまうことがわかります。

なぜなら、確率空間の定義(完全加法性)から、すべての実数$a$に対して、「$X>a$」となる事象が$\mathcal{F}$に入っていたとすると、

  • 「$X>a$」の余事象である「$X\leq a$」も$\mathcal{F}$に入っている。
  • 「$X\geq a$」という事象は
    「$X>a+0.1$」または「$X>a+0.01$」または「$X>a+0.001$」または …
    という事象と言い換えられるので、完全加法性から$\mathcal{F}$に入っている。
  • よって、「$X\geq a$」の余事象である「$X< a$」も$\mathcal{F}$に入っている。
  • 「$X=a$」という事象は、「$X\geq a$ かつ $X\leq a$」という事象なので、上の結果から$\mathcal{F}$に入っている。

ということがわかります。2つ目の説明などは、慣れていないとトリッキーに感じるかもしれません。

以上の話から、確率変数を次のように定義できます。

確率変数の定義
確率空間$(\Omega,\mathcal{F},P)$上の確率変数とは、$\Omega$を定義域とする関数で、すべての実数$a$に対して、
$\{\omega \in \Omega| X(\omega)>a\} \in \mathcal{F}$
(=$X>a$となる確率が計算できる)
を満たすものである。

このような性質を満たす関数を、$(\Omega,\mathcal{F},P)$上の可測関数とも呼びます。

まとめ

今回は、確率変数の定義と、なぜそのような定義になるのかを説明しました。次回は、期待値について解説したいと思います。

前回の記事→意味が分かる測度論的確率論(1)~確率空間

+3

作成者:

数学科の学生で、確率論、統計学を専攻しています。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です