確率論の基礎(6)

もう少しだけ\sigma-集合体の話を続けます。

応用上重要な\sigma-集合体として,実数{\mathbb R}上で定義されるBorel \sigma-集合体(Borel \sigma-field) {\cal B}({\mathbb R})があります。

今回は、このBorel \sigma-集合体について簡単に説明します。
Borel \sigma-集合体{\cal B}({\mathbb R})とは,すべての半開区間(a,b]の集まりから生成される{\mathbb R}上の\sigma-集合体のことです。ここにa,b \in {\mathbb R}です。

Borel \sigma-集合体は,半開区間(a,b]だけでなく様々な区間が要素として入ります。
例えば,\{ a \}, (a, b), [a, b], (a, +\infty), [a, +\infty),  (-\infty, a]等々です。

同様に,\overline{\mathbb R}上で定義された拡張されたBorel \sigma-集合体{\cal B}(\overline{\mathbb R})を考えることも出来ます。
ここに\overline{\mathbb R}=[-\infty, +\infty]です。

さらに,Borel \sigma-集合体は,容易にn次元ユークリッド空間に拡張できます。
n次元ユークリッド空間に拡張したBorel \sigma-集合体を{\cal B}({\mathbb R}^{n})で表すことにします。

 

確率論の基礎(5)

前回の記事「確率論の基礎(4)」で,\sigma-集合体は「観測」にも密接に関連したものであると言いました。
ここまでは,\sigma-集合体が与えられていると考えてきましたが,例えば,数理ファイナンスへの応用の場合を考えると,投資家の投資戦略は「現時点までの観測」(から得られる情報)に基づいた戦略を取ることが出来るはずです。
そこで,投資家が現時点で持っている情報を表すために「観測」から作られる\sigma-集合体を考えることが必要になります。

このような状況を考える際に必要となるのが生成された\sigma-集合体です。

以下で生成された\sigma-集合体を定義します。

{\cal P}(\Omega)\Omegaのすべての部分集合の集まりとし,{\cal C}{\cal P}(\Omega)の部分集合族,すなわち,{\cal C} \subset {\cal P}(\Omega)である部分集合の集まりとします。

ここで,{\cal C}を含む\Omega上で定義されるすべての\sigma-集合体の集まりを考えます。
この集まりは,{\cal P}(\Omega)がその集まりに入っているので空ではありません。
また,これらのすべての\sigma-集合体の積は,やはり\sigma-集合体になり,それは{\cal C}を含む最小の\sigma-集合体になります。この\sigma-集合体のことを{\cal C}によって生成される\sigma-集合体と呼び,\sigma({\cal C})と表記します。

要は,部分集合の集まり{\cal C}\sigma-集合体になっていないかもしれないので,\sigma-集合体になるように必要十分な部分集合を加えて\sigma-集合体にしたものが\sigma({\cal C})であると考えるとよいです。

 

確率論の基礎(4)

今回は,\sigma-集合体とその意味についてもう少し考えます。

まず,ある標本空間\Omegaに対して,\Omega上の\sigma-集合体は一意ではないことに注意して下さい。
例えば,
{\cal F}_{1} = \{ \emptyset, \Omega \}.
{\cal F}_{2} = \{ \emptyset, A, A^{c}, \Omega \} \quad (A \subset \Omega).
 {\cal F}_{3} = \{ \Omega のすべての部分集合  \}.
とすると,{\cal F}_{1}, {\cal F}_{2}, {\cal F}_{3}はすべて\Omega上の\sigma-集合体となります。

 

今まで\sigma-集合体という何か小難しそうなものを考えてきましたが,これは結局何なのでしょうか?
以下で,確率論の応用における一つの考え方を大まかに説明します。

まず,上で見たように同じ標本空間上で定義される\sigma-集合体は一意ではないことに注意しましょう。
では,上の例での{\cal F}_{1}, {\cal F}_{2}, {\cal F}_{3}の違いは何なのでしょうか?
一つの答えは,これらは「標本空間をどれだけ細かく区別出来るか」の違いです。

例えば,{\cal F}_{1}は最も小さい\sigma-集合体ですが(最も小さいという意味は,任意の\sigma-集合体{\cal F}について{\cal F}_{1} \subset {\cal F}が成立するという意味です。),これは実質的には何も区別できない\sigma-集合体です。{\cal F}_{2}は,事象Aが発生するかどうかだけを区別出来る\sigma-集合体です。また,{\cal F}_{3}は最も大きい\sigma-集合体ですが(最も大きいという意味は,任意の\sigma-集合体{\cal F}について{\cal F}_{3} \supset {\cal F}が成立するという意味です。),これは標本一つ一つまで区別出来ます。

 

したがって,\sigma-集合体は「情報」に関連していると解釈することが出来ます。「情報」を豊富に持っているということは,
「物事をより細かく分類できる」=「標本空間をより細かく区別出来る」
ということになります。
この観点からは,{\cal F}_{1}よりも{\cal F}_{2}が, {\cal F}_{2}よりも{\cal F}_{3}が情報を豊富に持っている\sigma-集合体であると言えます。

 

このことを,数理ファイナンスへの応用を考慮した言葉でもう少しだけ説明しておきます。

もし投資家が{\cal F}_{3}に相当する情報を持っているならば,その投資家にとっては,すべての事象に関して確率的な曖昧さは全くなくなることになります。

また,事象Aを「日経平均が時刻txである」という事象とするならば,もし投資家が{\cal F}_{2}に相当する情報を持っているならば,その投資家にとっては「日経平均が時刻txである」かどうかは,確率的な曖昧さはなく既知であることになります。

このような観点からは,確率は持っている情報を最大限利用しても残る曖昧さの大きさを表していると考えることもできます。
応用上は,「情報」は「観測」によって得られることが多いため,\sigma-集合体は「観測」にも密接に関連したものであるとも言えます。

 

 

確率論の基礎(3)

前の記事「確率論の基礎(1)」,「確率論の基礎(2)」において,確率測度は標本空間の部分集合の集まり上で定義されている部分集合の「大きさ」を測るものであると言いました。

さらに,標本空間の部分集合の集まりはどのようなものでも良いわけでもなく制約があり,その制約は主に部分集合の「大きさ」を矛盾なく定義するためのものであることを述べました。

では,どのような部分集合の集まりなら部分集合の「大きさ」を矛盾なく定義できるのでしょうか?

部分集合の集まりの各要素で「大きさ」を矛盾なく定義できるためには,以下の性質を持っていることが必要と思われます。

考える部分集合の集まりは,補集合演算と可算回の和,積演算について閉じている必要がある。

すなわち,ある部分集合の大きさが定義されるのであれば,その補集合の大きさも定義されないと不都合だし,ある部分集合A, Bの大きさが定義されるのであれば,ABの和集合の大きさも定義されないと不都合だし,ABの積集合の大きさも定義されないと不都合だということです。さらに,それらの演算の結果できた集合に,さらに演算を可算回繰り返して出来た集合も大きさが定義されないと不都合であるということです。


上で述べたような性質を持つ部分集合族のクラスは, \sigma-集合体(\sigma-field, \sigma-加法族)と呼ばれ,以下のように定義されます。

定義: 標本空間\Omegaの部分集合の集まり{\cal F}が以下の条件を満たすならば,それは\Omega上の\sigma-集合体(\sigma-field on \Omega)であると言われる。

  1.  \Omega \in {\cal F}
  2.  A \in {\cal F} \Rightarrow A^{c} \in {\cal F}
  3.  A_{i} \in {\cal F} \; (i=1,2,\ldots) \; \Rightarrow \cup_{i=1}^{\infty} A_{i} \in {\cal F}

ここにA^{c}Aの補集合を表す。

ド・モルガンの法則から集合の積は集合の和と補集合で表すことが出来るので,上の定義で可算回の積演算についても{\cal F}は閉じていることになります。

 

確率は,\sigma-集合体{\cal F}のすべての要素に対して割当てられます。
すなわち,{\cal F}の任意の要素,すなわち,任意の事象Aの「大きさ」を測ることが可能で,
その「大きさ」のことを事象Aの確率と呼びます。

このようにして定義された(\Omega, {\cal F})可測空間(measurable space)と呼ばれます。

確率論の基礎(2)

前回の記事「確率論の基礎(1)」で,確率測度は,標本の部分集合から[0,1]への写像であって,標本から[0,1]への写像ではないことに注意して下さいということを言いました。
なぜ,標本から[0,1]への写像としないのでしょうか?
それは,以下の技術的な理由によります。

例えば,区間[0,1]からランダムに数を1つ選ぶとします。
このとき,どの数も同様に選ばれるので,確率はすべて同じにしたいです。
しかし,[0,1]には無限個(正確には,可算でもない)の数があるので,どんなに小さな正の確率を与えても,確率の和を1とすることができないことになります。
一方,その確率を0とすると,どこにも正の確率がないことになってしまいます。

この困難を解決するために,確率論では,確率を標本ではなく,標本の集合に対して定義します。

このことは,長さ,面積,体積などの大きさを測るときの基準に「点」に大きさを与えるのではなく,点の集合である直線,正方形,立方体に大きさを与え,それを基準に任意の図形の長さ,面積,体積を決めているのと同じことです。

次回は,\sigma-集合体と事象について解説します。

確率論の基礎(1)

確率論では,ランダム試行の任意の結果を,標本(sample)と呼びます。
また,すべての可能な結果の集合を標本空間(sample space)と呼びます。

確率論では,標本空間は単に集合でありさえすればよく,標本は標本空間の要素でありさえすればよいです。
なので,標本空間は[0,1)でもよいし,すべての実数の集合でもよいし,フーリエ変換可能なすべての関数の集合でもよいし,実現するorした可能性のある「世界」のすべての集合でもよいし,アルファベットで構成されるすべての文字列の集合(この集合には,アルファベットで書かれた現在世の中に存在する文学作品,これから世の中に発表される文学作品も,どんなものでもすべて標本として含みます)でもよく,集合でありさえすれば何でもよいです。

このブログでは,標本,標本空間は,それぞれ\omega\Omegaで表記することが多いです。

後で定義しますが,確率測度は,標本空間の「部分集合の集まり」から[0,1]への写像です。
ただし,必ずしも標本空間のすべての部分集合の集まりではありません。また,どのような
標本空間の部分集合の集まりでも良いわけでもなく,制約があります。
確率測度は,部分集合の「大きさ」を測るもので,その「大きさ」が0以上1以下の実数値を取るものであると考えるとよいです。
上で書いた標本空間の部分集合の集まりに関する制約は,主に部分集合の「大きさ」を矛盾なく定義するためのものです。

実は,皆さんがよく知っている長さ,面積,体積等も部分集合の「大きさ」を測ったものであり,
確率論で展開される理論はそれをもっと一般化したものです。
面積や体積が「積分」で表されるように,ここでの部分集合の大きさも「積分」で表されます。
そのため「積分」も一度きっちり定義することが必要になるので,後ほど積分に関する定義もします。

応用上は,部分集合の「大きさ」(=確率)を,その部分集合の「起こりやすさ」に対応させてモデル化を行った「確率モデル」がよく使われます。
ここで,確率測度は,標本の部分集合から[0,1]への写像であって,標本から[0,1]への写像ではないことに注意して下さい。
なぜ,標本から[0,1]への写像としないのでしょうか?

続きは,次回に^^