このとき,私たちは新しく得られた情報をどのように使って信念や知識を
現実によりふさわしいものに更新していくことがべきだろうか.その信念が
確率判断にもとづいた事象の確からしさの程度であるときには,確率の規範
的理論がひとつの指針を提供してくれる.いま,
個人的確率 (PP: personal probability)
と呼ばれる
主観確率 (SP: subjective probability)
の一種を考える.主観確率は個人のもつ主観的な確からしさの表現で,信念
の度合ともいうべきものだが,PPはさらに確率論のさまざまな制約条件を
みたすものとする.この意味でPPは理想化された合理的な人間の信念の度
合 (Lee, 1971)だということもできる.ある事象のPPを新しく入手した情
報に照らしてどう更新すべきかが確率判断の修正の問題である.私たちのよ
うな普通の人間の信念やその機能については複雑な議論があって,よくわか
っていないことも多いのだが,PPは間違ったり,自己矛盾に陥ったりする
ことのない,確率論に忠実な,理想的な信念である.
PPの存在を仮定したときに確率の規範的理論の提供する行動の指針がベ
イズの規則である.ベイズの定理は次のようなどなたも御存知の確率論の公
理から出発する.
ある仮想的な調査を考える.この調査で男性15人,女性85人,合計1
00人の男女に食べ物の好みを質問したところ,男性はうち12人が辛党で
3人が甘党であることがわかったとする.これに対して,女性は68人が甘
党で17人だけが辛党である(表2.3参照).さてこの100人の中から
無作為に1人を選ぶとこの人が男性である確率は15%,女性である確率は
85%であるといってよいだろう.この人が女性であってかつ甘党である確
率はといえば,そういう人は100人のうち68人いるのだから68%であ
る.ところで,いま選ばれたのは男性であるという「条件つきの」甘党の確
率はどれくらいか.これは15人のうちの3人,あるいは.03/.15,
すなわち20%である.
表2.3 嗜好と性別によるクロス・テーブル
男性 | 女性 | ||
---|---|---|---|
甘党 | 3 | 68 | 71 |
辛党 | 12 | 17 | 29 |
15 | 85 | 100 | |
とりだされた人が男性である確率をP(男),女性である確率をP(女)
とし,甘党あるいは辛党である確率をそれぞれP(甘),P(辛)と表わす
ことにする.また,同時確率を,例えばその人が男性でありかつ甘党である
ならば,P(男・甘)のように表わす.ある人が同時に男性であり女性でも
あることは(普通は!)ありえないので,P(男・女)=0である.また
P(甘・辛)はP(辛・甘)に等しい.
さらに,P(辛|男)はある人が男性であるという条件のもとでのその人
の辛党である確率,すなわち条件つき確率を表わすものとする.今度は一方
が条件になるということなので,P(辛|男)は一般的にはP(男|辛)と
等しいとはいえない.そこでこの2つの条件つき確率の間にどのような関係
があるか,一方から他方をひきだすにはどうしたらよいかを示したのが下の
式である.この式をもっと一般的な形で表わしたものがベイズの定理にほか
ならない.人間の属性として,性別と嗜好とどちらをより基本的なものとす
べきかは現在の文脈では重要ではない.従って性別を条件にすることも嗜好
を条件にすることも同じように可能である.
P(辛)・P(男|辛) P(辛|男) = 「「「「「「「「「「「「「「「「「「「「「「「「 P(辛)・P(男|辛)+P(甘)・P(男|甘)
さて,性別と味の好みという人間の具体的な属性を使ってベイズの規則を
構成するいくつかの概念とそれらの関係を説明してきたが,ここでもう少し
抽象的かつ一般的な表現をしてみたい.まずその前に,ベイズの定理そのも
のは,このように条件つき確率の間の関係を示したものにすぎないことを強
調しておこう.事象の具体的な内容や種類とは独立にこの関係は成立するわ
けである.ところで上の例で,男性か女性かという「データ」を使って知り
たかったのは無作為に抽出したある人が辛党であるという「仮説」が真であ
る確からしさだったといえるだろう.排反なふたつの仮説をH1,H2,デー
タをD1,D2と表わすことにすると,上の式を次のように表現することがで
きる:
P(H1)・P(D1|H1) P(H1|D1) = 「「「「「「「「「「「「「「「「「「「「「「「「 P(H1)・P(D1|H1)+P(H2)・P(D1|H2)
P(Hm)・P(Dn|Hm),すなわち仮説Hm が正しいという条件のもとでの
データDnの得られる確率(尤度)と仮説Hm 自体の確率の積はHm とDn
の同時確率に等しい.従って,この等式が示しているのは,データDn が獲
得されたという事象を条件としたときの仮説Hm が正しいという事象の確率
は,すべての仮説H1,H2, ... のそれぞれとデータDn の同時確率の合計
に対するHm とデータDn の同時確率の比(割合)で表わすことができると
いうことである.この同時確率の合計はすなわち,Dn の確率にほかならな
い.言い替えると,あるデータの得られるすべての場合の中で,そのデータ
とある特定の仮説が同時に生起する場合の割合はどれくらいかをもって,そ
のデータを条件にしたその特定の仮説の確からしさを決めようということで
ある.
ベイズの定理は後者の表現のように仮説とデータの関係で表わされるのが
一般的だが,ここでいう仮説とデータは全く対称的であるのは,既に性別と
嗜好の例でみたとおりである.私たちが仮説とデータの関係からおもいうか
べる抽象的−具体的とか,どちらが先に存在しているとかいった関係を一応
忘れてかかる必要がある.
このことの意味をもう少し考えてみよう.あ
る与えられた事態で,その事態の特定の側面を記述する互いに排反な仮説が
あるとする.単純な例はその事態についてAという主張ができるという仮説
と,できないという仮説がある場合であろう.
例えば,今ここに一枚の硬貨
があってそれを投げては裏表を当てるようなゲームがあったとする.このと
き
この硬貨にはなんの仕掛もないという仮説と,
いやそんなことはない,いかさまだという仮説
がありうる.それぞれの仮説の主張の正しさが,与えら
れた事態の中でどの程度の確からしさをもっているかということは,なんら
かの理論とか過去の類似の事態における経験からわかっている場合があるで
あろう.もしもそうした理論や経験を欠いている場合はどちらの主張も同じ
くらいの確からしさで正しいと仮定する.どちらだかわからないということ
を,どちらも同じくらいに確からしいとういことを同一視する仮定には批判
もあるが,一応これをうけいれて何が起きるか試してみてもよいであろう.
硬貨に一見それとわからないような仕掛をするのはなかなか大変だろうから,
まず90%は公平な硬貨であろうとするなら,これが
事前確率
に当たる.公平な硬貨だとの仮説が正しければ,この硬貨を投げたときに裏
のでる確率は1/2である.これが
尤度
である.仕掛があるときに裏のでる確率は決めに
くいけれど,1/2からは充分はなれていて,かつそれほどあからさまにわ
かってしまわない3/4位だとする.だから,どちらの仮説が正しいかにつ
いての情報があれば,その正しい仮説のもとでの硬貨の裏の面がでる確率は
1/2か3/4のどちらかに定まる.これは仕掛のあるものないもの2種類
の硬貨を現実にもっている人がいて,どちらの硬貨を使うか教えてくれるよ
うな場合である.もっと現実的なケースは,実際に硬貨を投げてみてその裏
表の出方のデータからどちらの仮説が正しいかを判定するというものであろ
う.2度や3度続けて裏がでてもそんなことは公平な硬貨でも頻繁に起きる
ことだ.しかし10回も20回も裏が続いたらどうか.これは公平な硬貨で
も小さな確率にせよ起こり得ることではあるが,仕掛のある硬貨と考えた方
がよりそれもっともらしいということになるのではないか.そのもっともら
しさも裏がでるたびに少しづつ増えていくのが自然であろう.
このように,手にはいるデータがひとつだけでなく,いくつもの互いに独
立なデータがつぎつぎに獲得されるような場合は,あるデータによって確率
の判断を更新した結果である
事後確率
を,次のデータが手に入ったときには
事前確率とみなして,それを新しいデータで更新するということをいくらで
も繰り返すことができる.ベイズの定理を使って確率判断を修正することを
定めた規則を
ベイズの規則という.
(図2.4)
図2.4は上記の仮定のもとで硬貨の裏が出続けたとき,それぞれの仮説の
確からしさがどう変わっていくべきかを示したものである.
性別と嗜好の例は確率を相対頻度に対応させていた.一般には仮説の事前
確率や尤度は客観的には知られていないことが多い.しかし個人的確率も同
じように修正してよいというのがベイズの規則である.
主観確率と確率の規範的理論がずれている場合として有名なものに,トヴ
ェルスキーとカーネマンが発見した入手容易性(availability)や
代表性(representativeness)のヒューリスティックがある
(Kahneman, et al., 1982).代表性とは人々が局所的な性質,例えばサンプ
ルの性質が,すべての重要な点において大局的な,つまり例えば母集団の性
質に類似していなければならないと考える傾向をいい,入手容易性とは記憶
の中で類似の事象にアクセスする容易性に事象の生起確率の推定値が依存し
ていることをあらわす.
ベイズの規則に関しては,保守性(conservatism)と呼ばれる現象がみられ
る場合のあることが知られている(Edwards,1968).新しいデータが獲得によ
って意思決定者の確率の判断が修正される,その修正の幅がベイズの規則の
処方するものより小さくなる傾向をさしている.これらの問題についてはこ
の選書の佐伯の巻に詳しい(佐伯, 1986).
現在,エクスパート・システムの開発との関連で,仮説の確信度の処理の
方法は,ベイズの規則に加えて,ファジー論理 (fuzzy logic),シェイファ
ー・デンプスターの信念関数(Shafer-Dempster's belief functions),コー
エンの裏書モデル (endorsement model)など多数提案されている (Cohen,
1985).しかしこれらの新しい方法の利用者との関係における性質は,これ
までのところ意思決定理論の古典的なテーマであるベイズの規則や多属性効
用モデルほど詳しく調べられてはいない.今後の課題であろう.
* 文献集 | * 文頭 | * 目次 | * 小橋ホーム |
URL=http://www.kt.rim.or.jp/~kobashi/dm/ b88-24.htm