Kettei wo shiensuru: Chapter 2.4

Author: Y. Kobashi
Date : 2001/10/16 (modified); 1996/05/07 (created)

小橋康章，「決定を支援する」，東京大学出版会，１９８８
第２章　意思決定の研究

２．４　確率判断の修正

不確実な事態に対処することは意思決定行為のひとつの重要な要素である．不確実さは意思決定者自身の選択の結果にあらわれるかもしれない．せっかくよかれと思ってある行為を選択しても，自然のまわりあわせで期待した結果が得られないこともあるし，意思決定者と同様に知能をもった他者が介入して意思決定者にとって望ましい結果が起きるのを妨害することもある．また，情報にもとづいた判断に決定が依存することは珍しくないが，その情報にも常に不確実性がつきまとっている．そこでこの節では不確実性の扱いに関する規範的な理論である確率論の復習をかねて，ベイズの規則による確率判断の修正をとりあげる．確率論を既によく御存知の読者は前半２．４．１をとばして読み進まれることをお勧めする．この２．４．１で述べる規則は，「人間の心の中で起きる判断の過程は現実にこうである」という記述とは違う．あくまで，一定の公理を受け入れるなら，このように考えるのがいちばん理屈にあう，という規範的な議論である．

２．４．１　ベイズの規則　［２Ｂ］

道を歩いていると向こうからどこかで会ったことがあるような人がやってくる．あれは前に一度名刺を交換したことがある鈴木さんだろうか．洋服の色がこの前とにているのでたぶん彼ではないかと思う．顔の形はおぼえがあるので，鈴木さんであるらしいという気持ちがいっそう強くなる．もう少し近づいてみると髪の形が違う．やっぱり別人であろうか．鈴木さんなら向こうも私の顔はみたのだから挨拶してくれてもよさそうなのに知らん顔をしているので別人だと思う気持ちがやや強くなる．しかし彼は近眼なのに眼鏡をかけていないことを思い出して，ひょっとすると気がつかないのかと思う．声をかけてみる．やっぱり知人の鈴木さんだった．このように次々とえられるデータにもとづいて信念やあらかじめもっていた仮説の確からしさが変化していくのが自然だと思われる事態を考える．

このとき，私たちは新しく得られた情報をどのように使って信念や知識を現実によりふさわしいものに更新していくことがべきだろうか．その信念が確率判断にもとづいた事象の確からしさの程度であるときには，確率の規範的理論がひとつの指針を提供してくれる．いま， 個人的確率 (PP: personal probability) と呼ばれる 主観確率 (SP: subjective probability) の一種を考える．主観確率は個人のもつ主観的な確からしさの表現で，信念の度合ともいうべきものだが，ＰＰはさらに確率論のさまざまな制約条件をみたすものとする．この意味でＰＰは理想化された合理的な人間の信念の度合 (Lee, 1971)だということもできる．ある事象のＰＰを新しく入手した情報に照らしてどう更新すべきかが確率判断の修正の問題である．私たちのような普通の人間の信念やその機能については複雑な議論があって，よくわかっていないことも多いのだが，ＰＰは間違ったり，自己矛盾に陥ったりすることのない，確率論に忠実な，理想的な信念である．

ＰＰの存在を仮定したときに確率の規範的理論の提供する行動の指針がベイズの規則である．ベイズの定理は次のようなどなたも御存知の確率論の公理から出発する．

（１）基本的な公理と定義

確率は０から１までの実数値であり，確実な事象の確率は１である．
生じうるすべての，互いに排反な（同時には生じえない）事象の確率の合計は１である．
互いに排反な事象のどちらかが生じる確率は，それぞれの事象の確率の和に等しい．
互いに独立な事象１と事象２が同時に生じる確率（同時確率）は事象１の確率と事象２の確率の積に等しい．

これらの４つの公理からベイズの定理をひきだすことができるわけだが，もうひとつ条件つき確率という概念を定義しておきたい．

ある仮想的な調査を考える．この調査で男性１５人，女性８５人，合計１００人の男女に食べ物の好みを質問したところ，男性はうち１２人が辛党で３人が甘党であることがわかったとする．これに対して，女性は６８人が甘党で１７人だけが辛党である（表２．３参照）．さてこの１００人の中から無作為に１人を選ぶとこの人が男性である確率は１５％，女性である確率は８５％であるといってよいだろう．この人が女性であってかつ甘党である確率はといえば，そういう人は１００人のうち６８人いるのだから６８％である．ところで，いま選ばれたのは男性であるという「条件つきの」甘党の確率はどれくらいか．これは１５人のうちの３人，あるいは．０３／．１５，すなわち２０％である．

表２．３　嗜好と性別によるクロス・テーブル

男性女性
甘党 3 68 71
辛党 12 17 29
15 85 100

	男性	女性
甘党	3	68	71
辛党	12	17	29
	15	85	100

（２）ベイズの定理

この１００人の中のある人が辛党かどうかを知りたいとき，まず男性１２人，女性１７人が辛党なので計２９人が辛党なのがわかっているから，この中から無作為に一人選んだ以上，その人が辛党である確率は２９％だと考える．それなら，はじめこの人が辛党である確からしさ（事前確率）が２９％だと思っていたところに，この人は男性であるという新しいデータがえられたとするとどうか．そうすると今度は，男性の場合は辛党の割合が８０％もあることがわかっているので，そのひとが辛党である確からしさも８０％に修正される．データによって修正されたの値の確率を事後確率という．

とりだされた人が男性である確率をＰ（男），女性である確率をＰ（女）とし，甘党あるいは辛党である確率をそれぞれＰ（甘），Ｐ（辛）と表わすことにする．また，同時確率を，例えばその人が男性でありかつ甘党であるならば，Ｐ（男・甘）のように表わす．ある人が同時に男性であり女性でもあることは（普通は！）ありえないので，Ｐ（男・女）＝０である．またＰ（甘・辛）はＰ（辛・甘）に等しい．

さらに，Ｐ（辛｜男）はある人が男性であるという条件のもとでのその人の辛党である確率，すなわち条件つき確率を表わすものとする．今度は一方が条件になるということなので，Ｐ（辛｜男）は一般的にはＰ（男｜辛）と等しいとはいえない．そこでこの２つの条件つき確率の間にどのような関係があるか，一方から他方をひきだすにはどうしたらよいかを示したのが下の式である．この式をもっと一般的な形で表わしたものがベイズの定理にほかならない．人間の属性として，性別と嗜好とどちらをより基本的なものとすべきかは現在の文脈では重要ではない．従って性別を条件にすることも嗜好を条件にすることも同じように可能である．

                              　　　Ｐ（辛）・Ｐ（男｜辛）
　　Ｐ（辛｜男）　＝　������������������������
                        Ｐ（辛）・Ｐ（男｜辛）＋Ｐ（甘）・Ｐ（男｜甘）

さて，性別と味の好みという人間の具体的な属性を使ってベイズの規則を構成するいくつかの概念とそれらの関係を説明してきたが，ここでもう少し抽象的かつ一般的な表現をしてみたい．まずその前に，ベイズの定理そのものは，このように条件つき確率の間の関係を示したものにすぎないことを強調しておこう．事象の具体的な内容や種類とは独立にこの関係は成立するわけである．ところで上の例で，男性か女性かという「データ」を使って知りたかったのは無作為に抽出したある人が辛党であるという「仮説」が真である確からしさだったといえるだろう．排反なふたつの仮説をＨ1，Ｈ2，データをＤ1，Ｄ2と表わすことにすると，上の式を次のように表現することができる：


                              　　　Ｐ（H1）・Ｐ（D1｜H1）
　　Ｐ（H1｜D1）　＝　������������������������
                        Ｐ（H1）・Ｐ（D1｜H1）＋Ｐ（H2）・Ｐ（D1｜H2）

Ｐ（Hm）・Ｐ（Dn｜Hm），すなわち仮説Ｈm が正しいという条件のもとでのデータＤｎの得られる確率（尤度）と仮説Ｈm 自体の確率の積はＨm とＤn の同時確率に等しい．従って，この等式が示しているのは，データＤn が獲得されたという事象を条件としたときの仮説Ｈm が正しいという事象の確率は，すべての仮説Ｈ1,Ｈ2, ...　のそれぞれとデータＤn の同時確率の合計に対するＨm とデータＤn の同時確率の比（割合）で表わすことができるということである．この同時確率の合計はすなわち，Ｄn の確率にほかならない．言い替えると，あるデータの得られるすべての場合の中で，そのデータとある特定の仮説が同時に生起する場合の割合はどれくらいかをもって，そのデータを条件にしたその特定の仮説の確からしさを決めようということである．

ベイズの定理は後者の表現のように仮説とデータの関係で表わされるのが一般的だが，ここでいう仮説とデータは全く対称的であるのは，既に性別と嗜好の例でみたとおりである．私たちが仮説とデータの関係からおもいうかべる抽象的－具体的とか，どちらが先に存在しているとかいった関係を一応忘れてかかる必要がある．

（３）ベイズの規則

例のようにすべての同時確率が簡単にわかるような場合はわざわざベイズの定理を使う必要はない．しかし一般には，あるデータがえられたという条件のもとでの，ある仮説が真であることの事後確率は，仮説の事前確率とそれぞれの仮説のもとでのそれぞれのデータの得られる確率（これを尤度と呼ぶ）からひきだすのが便利である．

このことの意味をもう少し考えてみよう．ある与えられた事態で，その事態の特定の側面を記述する互いに排反な仮説があるとする．単純な例はその事態についてＡという主張ができるという仮説と，できないという仮説がある場合であろう．

例えば，今ここに一枚の硬貨があってそれを投げては裏表を当てるようなゲームがあったとする．このとき この硬貨にはなんの仕掛もないという仮説と， いやそんなことはない，いかさまだという仮説 がありうる．それぞれの仮説の主張の正しさが，与えられた事態の中でどの程度の確からしさをもっているかということは，なんらかの理論とか過去の類似の事態における経験からわかっている場合があるであろう．もしもそうした理論や経験を欠いている場合はどちらの主張も同じくらいの確からしさで正しいと仮定する．どちらだかわからないということを，どちらも同じくらいに確からしいとういことを同一視する仮定には批判もあるが，一応これをうけいれて何が起きるか試してみてもよいであろう．硬貨に一見それとわからないような仕掛をするのはなかなか大変だろうから，まず９０％は公平な硬貨であろうとするなら，これが 事前確率 に当たる．公平な硬貨だとの仮説が正しければ，この硬貨を投げたときに裏のでる確率は１／２である．これが尤度である．仕掛があるときに裏のでる確率は決めにくいけれど，１／２からは充分はなれていて，かつそれほどあからさまにわかってしまわない３／４位だとする．だから，どちらの仮説が正しいかについての情報があれば，その正しい仮説のもとでの硬貨の裏の面がでる確率は１／２か３／４のどちらかに定まる．これは仕掛のあるものないもの２種類の硬貨を現実にもっている人がいて，どちらの硬貨を使うか教えてくれるような場合である．もっと現実的なケースは，実際に硬貨を投げてみてその裏表の出方のデータからどちらの仮説が正しいかを判定するというものであろう．２度や３度続けて裏がでてもそんなことは公平な硬貨でも頻繁に起きることだ．しかし１０回も２０回も裏が続いたらどうか．これは公平な硬貨でも小さな確率にせよ起こり得ることではあるが，仕掛のある硬貨と考えた方がよりそれもっともらしいということになるのではないか．そのもっともらしさも裏がでるたびに少しづつ増えていくのが自然であろう．

このように，手にはいるデータがひとつだけでなく，いくつもの互いに独立なデータがつぎつぎに獲得されるような場合は，あるデータによって確率の判断を更新した結果である 事後確率 を，次のデータが手に入ったときには事前確率とみなして，それを新しいデータで更新するということをいくらでも繰り返すことができる．ベイズの定理を使って確率判断を修正することを定めた規則を ベイズの規則という．

（図２．４）

図２．４は上記の仮定のもとで硬貨の裏が出続けたとき，それぞれの仮説の確からしさがどう変わっていくべきかを示したものである．

性別と嗜好の例は確率を相対頻度に対応させていた．一般には仮説の事前確率や尤度は客観的には知られていないことが多い．しかし個人的確率も同じように修正してよいというのがベイズの規則である．

２．４．２　主観確率とそのバイアス　［２Ａ］

それでは現実に人間はベイズの規則のように振舞うのだろうか．いやそれよりも先に，主観的な確からしさをどの程度個人的「確率」とみてよいのか，すなわち主観的に表わされた確からしさの判定値は，どの程度確率論的な確率としての条件をみたしているのだろうか．その答えは判定しようとする不確実現象の性質に強く影響されるらしい（戸田,1982)．主観的な確からしさの判定の評価を行なうキャリブレーション (calibration)という方法がある．原理は，ある評価者が確からしさの判定値をｘとした事象が実際に生じた相対頻度ｙを求め，ｘの関数としてのｙのグラフをプロットする．このときもしも観測された値がｙ＝ｘの直線上に並んでいるなら，この評定者の主観確率値は非常によくキャリブレートされているという．観測値がこの線の上方にあれば自信過小，下にあれば自信過大の傾向があることになる．例えば「某所にスーパーが３ヶ月以内にできるか」とか，「アメリカ大統領は１年以内に中国を訪問するか」といった，判定者本人の知識と直接関係ない近未来の事象は比較的正確だが，本人の知識を試されるような事態だと自信過大気味な結果がえられるという．

主観確率と確率の規範的理論がずれている場合として有名なものに，トヴェルスキーとカーネマンが発見した入手容易性(availability)や代表性(representativeness)のヒューリスティックがある (Kahneman, et al., 1982)．代表性とは人々が局所的な性質，例えばサンプルの性質が，すべての重要な点において大局的な，つまり例えば母集団の性質に類似していなければならないと考える傾向をいい，入手容易性とは記憶の中で類似の事象にアクセスする容易性に事象の生起確率の推定値が依存していることをあらわす．

ベイズの規則に関しては，保守性(conservatism)と呼ばれる現象がみられる場合のあることが知られている(Edwards,1968)．新しいデータが獲得によって意思決定者の確率の判断が修正される，その修正の幅がベイズの規則の処方するものより小さくなる傾向をさしている．これらの問題についてはこの選書の佐伯の巻に詳しい(佐伯, 1986)．

現在，エクスパート・システムの開発との関連で，仮説の確信度の処理の方法は，ベイズの規則に加えて，ファジー論理 (fuzzy logic)，シェイファー・デンプスターの信念関数(Shafer-Dempster's belief functions)，コーエンの裏書モデル (endorsement model)など多数提案されている (Cohen, 1985)．しかしこれらの新しい方法の利用者との関係における性質は，これまでのところ意思決定理論の古典的なテーマであるベイズの規則や多属性効用モデルほど詳しく調べられてはいない．今後の課題であろう．

２　意思決定の研究問題
２．１　意思決定研究の分類
２．２　意思決定問題
２．３　属性で表現される選択肢
２．４　確率判断の修正
２．５　確からしさと価値
２．６　結論

E-mail: PDB00176@nifty.ne.jp (Yasuaki KOBASHI, Tokyo)

* 文献集

* 文頭

* 目次

* 小橋ホーム

URL=http://www.kt.rim.or.jp/~kobashi/dm/ b88-24.htm

２．４ 確率判断の修正