前回の記事では、確率空間(Ω,F,P)(Ω,F,P)の定義と意味を紹介しました。そこでは、「事象」というのは、ΩΩの部分集合として表すことができ、その中で確率を測ることができるものをFFに入れるのでした。また、FFやPPが完全加法性と呼ばれる性質を満たさなければならないことも述べました。
今回の記事では、そのことをふまえ、確率変数を定義したいと思います。
確率変数とは?
「確率変数」とは、高校では例えば「起こった事象に応じて定まる変数」のような形で習うと思うます。例えば、サイコロを1回ふったとき、出た目をを4で割った余りXXとします。すると、例えば出た目が2ならばX=2X=2となり、出た目が5ならばX=1X=1となるように、出た目に応じてXXの値は変化します。また、X=1X=1となる確率は1313、X=3X=3となる確率は1616のように、XXが各値を取る確率を計算することができます。
今の話を総合すると、確率変数とは
- 起こった事象に応じて値が定まる
- 確率変数が各値を取る確率が計算できる
という条件を満たしている必要がありそうです。それぞれをもう少し深堀してみましょう。
実は最初の「事象に応じて定まる」という表現は実は正しくありません。例えば上の例の場合、「奇数の目が出るという事象」に対してはXXの値は一つに定まりません(1の目が出たときはX=1X=1ですし、3の目が出ればX=3X=3です)。むしろ、「1の目が出る」といった「根源事象=それ以上分割できない事象」に対応して、値が定まっているというほうが正しいです。
確率空間(Ω,F,P)(Ω,F,P)で考えると、「根源事象」をすべて集めた集合は、標本空間ΩΩになりますので、先ほどの条件1は、
確率変数は、定義域が標本空間ΩΩの関数である。
ということができます。
先ほどのサイコロの例では、1の目が出ることを①などと書くことにすると、標本空間はΩ=Ω={①,②,③,④,⑤,⑥}となり、確率変数XXは
X(①)=1,X(②)=2,X(③)=3,X(④)=4,X(⑤)=1,X(⑥)=2
という関数になっています。
次に、先ほどの条件2「確率変数が各値を取る確率が計算できる」について考えてみましょう。先ほどの例で、例えばX=1X=1になる確率は、
「X=1になるのは、1または5が出るときなので、確率1/3」
と計算できます。
これを確率空間の話で見てみると、
「X(ω)=1X(ω)=1となるωは、①と⑤である。」
↓
「X=1という事象は、{①,⑤}(1または5の目が出る)という事象と同じである。」
↓
「P({①,⑤})=1/3なので、X=1となる確率は1/3」
という計算を行っていることになります。
これはつまり、
- X=1という事象は、{ω∈Ω|X(ω)=1} (X(ω)=1となるω∈Ωの集合) に対応する。
- X=1となる確率は、P({ω∈Ω|X(ω)=1})に対応する。
ということができます。このことから、X=1となる確率が計算できたのは、{ω∈Ω|X(ω)=1}という事象の確率が計算できたことに由来していることがわかります。
※ なお、{ω∈Ω|X(ω)=1}という集合は、よく{X=1}などと省略して書いたりします。しかし、慣れていないうちはこのような書き方をしてしまうと、どのような集合を意味しているのか意識するのが難しいと思いますので、この記事では省略せずに書きたいと思います。
さて、前回の記事に書いたように、一般の確率空間(Ω,F,P)では、すべての事象(=Ωの部分集合)の確率が計算できるとは限りません。確率が計算できる事象たちをすべて集めたのが、Fという集合だったのでした。
従って、
「X=aとなる確率が計算できる」
ということは、
「{ω∈Ω|X(ω)=a}がFに入っている」
ということと同じです。
これをもって確率変数の定義とすればよいでしょうか?しかし、これだけでは例えば「X=1となる確率」は計算できても、例えば、「Xが1以上となる確率」などは計算できないかもしれません。もっと言うと、すべての実数aに対して、
- X=aとなる確率
- X>aとなる確率
- X≥aとなる確率
- X<aとなる確率
- X≤aとなる確率
はすべて計算できてほしいわけです。そこでこれらの確率がすべて計算できることを確率変数の定義としても良いのですが、実は、確率空間の定義から、すべての実数aに対して、
- X>aとなる確率
が計算できれば、残りも計算できてしまうことがわかります。
なぜなら、確率空間の定義(完全加法性)から、すべての実数aに対して、「X>a」となる事象がFに入っていたとすると、
- 「X>a」の余事象である「X≤a」もFに入っている。
- 「X≥a」という事象は
「X>a+0.1」または「X>a+0.01」または「X>a+0.001」または …
という事象と言い換えられるので、完全加法性からFに入っている。 - よって、「X≥a」の余事象である「X<a」もFに入っている。
- 「X=a」という事象は、「X≥a かつ X≤a」という事象なので、上の結果からFに入っている。
ということがわかります。2つ目の説明などは、慣れていないとトリッキーに感じるかもしれません。
以上の話から、確率変数を次のように定義できます。
確率変数の定義
確率空間(Ω,F,P)上の確率変数とは、Ωを定義域とする関数で、すべての実数aに対して、
{ω∈Ω|X(ω)>a}∈F
(=X>aとなる確率が計算できる)
を満たすものである。
このような性質を満たす関数を、(Ω,F,P)上の可測関数とも呼びます。
まとめ
今回は、確率変数の定義と、なぜそのような定義になるのかを説明しました。次回は、期待値について解説したいと思います。
前回の記事→意味が分かる測度論的確率論(1)~確率空間