Author: Y. Kobashi
Date : 2001/10/16 (modified); 1996/05/07 (created)



小橋康章,「決定を支援する」,東京大学出版会,1988
第2章 意思決定の研究

2.4 確率判断の修正


不確実な事態に対処することは意思決定行為のひとつの重要な要素である. 不確実さは意思決定者自身の選択の結果にあらわれるかもしれない.せっか くよかれと思ってある行為を選択しても,自然のまわりあわせで期待した結 果が得られないこともあるし,意思決定者と同様に知能をもった他者が介入 して意思決定者にとって望ましい結果が起きるのを妨害することもある.ま た,情報にもとづいた判断に決定が依存することは珍しくないが,その情報 にも常に不確実性がつきまとっている.そこでこの節では不確実性の扱いに 関する規範的な理論である確率論の復習をかねて,ベイズの規則による確率 判断の修正をとりあげる.確率論を既によく御存知の読者は前半2.4.1 をとばして読み進まれることをお勧めする.この2.4.1で述べる規則は, 「人間の心の中で起きる判断の過程は現実にこうである」という記述とは違 う.あくまで,一定の公理を受け入れるなら,このように考えるのがいちば ん理屈にあう,という規範的な議論である.

2.4.1 ベイズの規則 [2B

道を歩いていると向こうからどこかで会ったことがあるような人がやってく る.あれは前に一度名刺を交換したことがある鈴木さんだろうか.洋服の色 がこの前とにているのでたぶん彼ではないかと思う.顔の形はおぼえがある ので,鈴木さんであるらしいという気持ちがいっそう強くなる.もう少し近 づいてみると髪の形が違う.やっぱり別人であろうか.鈴木さんなら向こう も私の顔はみたのだから挨拶してくれてもよさそうなのに知らん顔をしてい るので別人だと思う気持ちがやや強くなる.しかし彼は近眼なのに眼鏡をか けていないことを思い出して,ひょっとすると気がつかないのかと思う.声 をかけてみる.やっぱり知人の鈴木さんだった.このように次々とえられる データにもとづいて信念やあらかじめもっていた仮説の確からしさが変化し ていくのが自然だと思われる事態を考える.

このとき,私たちは新しく得られた情報をどのように使って信念や知識を 現実によりふさわしいものに更新していくことがべきだろうか.その信念が 確率判断にもとづいた事象の確からしさの程度であるときには,確率の規範 的理論がひとつの指針を提供してくれる.いま, 個人的確率 (PP: personal probability) と呼ばれる 主観確率 (SP: subjective probability) の一種を考える.主観確率は個人のもつ主観的な確からしさの表現で,信念 の度合ともいうべきものだが,PPはさらに確率論のさまざまな制約条件を みたすものとする.この意味でPPは理想化された合理的な人間の信念の度 合 (Lee, 1971)だということもできる.ある事象のPPを新しく入手した情 報に照らしてどう更新すべきかが確率判断の修正の問題である.私たちのよ うな普通の人間の信念やその機能については複雑な議論があって,よくわか っていないことも多いのだが,PPは間違ったり,自己矛盾に陥ったりする ことのない,確率論に忠実な,理想的な信念である.

PPの存在を仮定したときに確率の規範的理論の提供する行動の指針がベ イズの規則である.ベイズの定理は次のようなどなたも御存知の確率論の公 理から出発する.

(1)基本的な公理と定義

  1. 確率は0から1までの実数値であり,確実な事象の確率は1である.
  2. 生じうるすべての,互いに排反な(同時には生じえない)事象の確率の 合計は1である.
  3. 互いに排反な事象のどちらかが生じる確率は,それぞれの事象の確率の 和に等しい.
  4. 互いに独立な事象1と事象2が同時に生じる確率(同時確率)は事象1 の確率と事象2の確率の積に等しい.
これらの4つの公理からベイズの定理をひきだすことができるわけだが,も うひとつ条件つき確率という概念を定義しておきたい.

ある仮想的な調査を考える.この調査で男性15人,女性85人,合計1 00人の男女に食べ物の好みを質問したところ,男性はうち12人が辛党で 3人が甘党であることがわかったとする.これに対して,女性は68人が甘 党で17人だけが辛党である(表2.3参照).さてこの100人の中から 無作為に1人を選ぶとこの人が男性である確率は15%,女性である確率は 85%であるといってよいだろう.この人が女性であってかつ甘党である確 率はといえば,そういう人は100人のうち68人いるのだから68%であ る.ところで,いま選ばれたのは男性であるという「条件つきの」甘党の確 率はどれくらいか.これは15人のうちの3人,あるいは.03/.15, すなわち20%である.

表2.3 嗜好と性別によるクロス・テーブル

男性女性
甘党 36871
辛党121729
1585100

(2)ベイズの定理

この100人の中のある人が辛党かどうかを知りたいとき,まず男性12人, 女性17人が辛党なので計29人が辛党なのがわかっているから,この中か ら無作為に一人選んだ以上,その人が辛党である確率は29%だと考える. それなら,はじめこの人が辛党である確からしさ(事前確率)が29%だと 思っていたところに,この人は男性であるという新しいデータがえられたと するとどうか.そうすると今度は,男性の場合は辛党の割合が80%もある ことがわかっているので,そのひとが辛党である確からしさも80%に修正 される.データによって修正されたの値の確率を事後確率という.

とりだされた人が男性である確率をP(男),女性である確率をP(女) とし,甘党あるいは辛党である確率をそれぞれP(甘),P(辛)と表わす ことにする.また,同時確率を,例えばその人が男性でありかつ甘党である ならば,P(男・甘)のように表わす.ある人が同時に男性であり女性でも あることは(普通は!)ありえないので,P(男・女)=0である.また P(甘・辛)はP(辛・甘)に等しい.

さらに,P(辛|男)はある人が男性であるという条件のもとでのその人 の辛党である確率,すなわち条件つき確率を表わすものとする.今度は一方 が条件になるということなので,P(辛|男)は一般的にはP(男|辛)と 等しいとはいえない.そこでこの2つの条件つき確率の間にどのような関係 があるか,一方から他方をひきだすにはどうしたらよいかを示したのが下の 式である.この式をもっと一般的な形で表わしたものがベイズの定理にほか ならない.人間の属性として,性別と嗜好とどちらをより基本的なものとす べきかは現在の文脈では重要ではない.従って性別を条件にすることも嗜好 を条件にすることも同じように可能である.

                                 P(辛)・P(男|辛)
  P(辛|男) = 「「「「「「「「「「「「「「「「「「「「「「「「
                        P(辛)・P(男|辛)+P(甘)・P(男|甘)

さて,性別と味の好みという人間の具体的な属性を使ってベイズの規則を 構成するいくつかの概念とそれらの関係を説明してきたが,ここでもう少し 抽象的かつ一般的な表現をしてみたい.まずその前に,ベイズの定理そのも のは,このように条件つき確率の間の関係を示したものにすぎないことを強 調しておこう.事象の具体的な内容や種類とは独立にこの関係は成立するわ けである.ところで上の例で,男性か女性かという「データ」を使って知り たかったのは無作為に抽出したある人が辛党であるという「仮説」が真であ る確からしさだったといえるだろう.排反なふたつの仮説をH1,H2,デー タをD1,D2と表わすことにすると,上の式を次のように表現することがで きる:


                                 P(H1)・P(D1|H1)
  P(H1|D1) = 「「「「「「「「「「「「「「「「「「「「「「「「
                        P(H1)・P(D1|H1)+P(H2)・P(D1|H2)

P(Hm)・P(Dn|Hm),すなわち仮説Hm が正しいという条件のもとでの データDnの得られる確率(尤度)と仮説Hm 自体の確率の積はHm とDn の同時確率に等しい.従って,この等式が示しているのは,データDn が獲 得されたという事象を条件としたときの仮説Hm が正しいという事象の確率 は,すべての仮説H1,H2, ... のそれぞれとデータDn の同時確率の合計 に対するHm とデータDn の同時確率の比(割合)で表わすことができると いうことである.この同時確率の合計はすなわち,Dn の確率にほかならな い.言い替えると,あるデータの得られるすべての場合の中で,そのデータ とある特定の仮説が同時に生起する場合の割合はどれくらいかをもって,そ のデータを条件にしたその特定の仮説の確からしさを決めようということで ある.

ベイズの定理は後者の表現のように仮説とデータの関係で表わされるのが 一般的だが,ここでいう仮説とデータは全く対称的であるのは,既に性別と 嗜好の例でみたとおりである.私たちが仮説とデータの関係からおもいうか べる抽象的−具体的とか,どちらが先に存在しているとかいった関係を一応 忘れてかかる必要がある.

(3)ベイズの規則

例のようにすべての同時確率が簡単にわかるような場合はわざわざベイズの 定理を使う必要はない.しかし一般には,あるデータがえられたという条件 のもとでの,ある仮説が真であることの事後確率は,仮説の事前確率とそれ ぞれの仮説のもとでのそれぞれのデータの得られる確率(これを尤度と呼ぶ) からひきだすのが便利である.

このことの意味をもう少し考えてみよう.あ る与えられた事態で,その事態の特定の側面を記述する互いに排反な仮説が あるとする.単純な例はその事態についてAという主張ができるという仮説 と,できないという仮説がある場合であろう.

例えば,今ここに一枚の硬貨 があってそれを投げては裏表を当てるようなゲームがあったとする.このと き この硬貨にはなんの仕掛もないという仮説と, いやそんなことはない,いかさまだという仮説 がありうる.それぞれの仮説の主張の正しさが,与えら れた事態の中でどの程度の確からしさをもっているかということは,なんら かの理論とか過去の類似の事態における経験からわかっている場合があるで あろう.もしもそうした理論や経験を欠いている場合はどちらの主張も同じ くらいの確からしさで正しいと仮定する.どちらだかわからないということ を,どちらも同じくらいに確からしいとういことを同一視する仮定には批判 もあるが,一応これをうけいれて何が起きるか試してみてもよいであろう. 硬貨に一見それとわからないような仕掛をするのはなかなか大変だろうから, まず90%は公平な硬貨であろうとするなら,これが 事前確率 に当たる.公平な硬貨だとの仮説が正しければ,この硬貨を投げたときに裏 のでる確率は1/2である.これが 尤度 である.仕掛があるときに裏のでる確率は決めに くいけれど,1/2からは充分はなれていて,かつそれほどあからさまにわ かってしまわない3/4位だとする.だから,どちらの仮説が正しいかにつ いての情報があれば,その正しい仮説のもとでの硬貨の裏の面がでる確率は 1/2か3/4のどちらかに定まる.これは仕掛のあるものないもの2種類 の硬貨を現実にもっている人がいて,どちらの硬貨を使うか教えてくれるよ うな場合である.もっと現実的なケースは,実際に硬貨を投げてみてその裏 表の出方のデータからどちらの仮説が正しいかを判定するというものであろ う.2度や3度続けて裏がでてもそんなことは公平な硬貨でも頻繁に起きる ことだ.しかし10回も20回も裏が続いたらどうか.これは公平な硬貨で も小さな確率にせよ起こり得ることではあるが,仕掛のある硬貨と考えた方 がよりそれもっともらしいということになるのではないか.そのもっともら しさも裏がでるたびに少しづつ増えていくのが自然であろう.

このように,手にはいるデータがひとつだけでなく,いくつもの互いに独 立なデータがつぎつぎに獲得されるような場合は,あるデータによって確率 の判断を更新した結果である 事後確率 を,次のデータが手に入ったときには 事前確率とみなして,それを新しいデータで更新するということをいくらで も繰り返すことができる.ベイズの定理を使って確率判断を修正することを 定めた規則を ベイズの規則という.

(図2.4)

図2.4は上記の仮定のもとで硬貨の裏が出続けたとき,それぞれの仮説の 確からしさがどう変わっていくべきかを示したものである.

性別と嗜好の例は確率を相対頻度に対応させていた.一般には仮説の事前 確率や尤度は客観的には知られていないことが多い.しかし個人的確率も同 じように修正してよいというのがベイズの規則である.

2.4.2 主観確率とそのバイアス [2A

それでは現実に人間はベイズの規則のように振舞うのだろうか.いやそれよ りも先に,主観的な確からしさをどの程度個人的「確率」とみてよいのか, すなわち主観的に表わされた確からしさの判定値は,どの程度確率論的な確 率としての条件をみたしているのだろうか.その答えは判定しようとする不 確実現象の性質に強く影響されるらしい(戸田,1982).主観的な確からしさ の判定の評価を行なうキャリブレーション (calibration)という方法がある. 原理は,ある評価者が確からしさの判定値をxとした事象が実際に生じた相 対頻度yを求め,xの関数としてのyのグラフをプロットする.このときも しも観測された値がy=xの直線上に並んでいるなら,この評定者の主観確 率値は非常によくキャリブレートされているという.観測値がこの線の上方 にあれば自信過小,下にあれば自信過大の傾向があることになる.例えば 「某所にスーパーが3ヶ月以内にできるか」とか,「アメリカ大統領は1年 以内に中国を訪問するか」といった,判定者本人の知識と直接関係ない近未 来の事象は比較的正確だが,本人の知識を試されるような事態だと自信過大 気味な結果がえられるという.

主観確率と確率の規範的理論がずれている場合として有名なものに,トヴ ェルスキーとカーネマンが発見した入手容易性(availability)や 代表性(representativeness)のヒューリスティックがある (Kahneman, et al., 1982).代表性とは人々が局所的な性質,例えばサンプ ルの性質が,すべての重要な点において大局的な,つまり例えば母集団の性 質に類似していなければならないと考える傾向をいい,入手容易性とは記憶 の中で類似の事象にアクセスする容易性に事象の生起確率の推定値が依存し ていることをあらわす.

ベイズの規則に関しては,保守性(conservatism)と呼ばれる現象がみられ る場合のあることが知られている(Edwards,1968).新しいデータが獲得によ って意思決定者の確率の判断が修正される,その修正の幅がベイズの規則の 処方するものより小さくなる傾向をさしている.これらの問題についてはこ の選書の佐伯の巻に詳しい(佐伯, 1986).

現在,エクスパート・システムの開発との関連で,仮説の確信度の処理の 方法は,ベイズの規則に加えて,ファジー論理 (fuzzy logic),シェイファ ー・デンプスターの信念関数(Shafer-Dempster's belief functions),コー エンの裏書モデル (endorsement model)など多数提案されている (Cohen, 1985).しかしこれらの新しい方法の利用者との関係における性質は,これ までのところ意思決定理論の古典的なテーマであるベイズの規則や多属性効 用モデルほど詳しく調べられてはいない.今後の課題であろう.


2 意思決定の研究問題
2.1 意思決定研究の分類
2.2 意思決定問題
2.3 属性で表現される選択肢
2.4 確率判断の修正
2.5 確からしさと価値
2.6 結論

E-mail: PDB00176@nifty.ne.jp (Yasuaki KOBASHI, Tokyo)
* 文献集 * 文頭 * 目次 * 小橋ホーム

URL=http://www.kt.rim.or.jp/~kobashi/dm/ b88-24.htm