誤解を避けるために,これはド・ゼーウゥらのいう最適行動モデル・アプローチ(第3章参照)に属する問いではないとはっきりことわっておこう.すなわち,私達は「人間は本来ベイズの規則に従うものだが,なんらかの阻害要因によってそのような行動の発現が阻害されている」と考える必要はない.そうではなくて,ベイズの規則は私達の認知システムにいわばあとからつけ加えられた,そして容易に正当化可能だという意味で望ましい,判断の支援の道具だとしたとき,それをどうしたら使えるようになるか,使われない理由は何かというのがここでの問いである.
すると最も手近な答えは,人は特に教えられたのでなければベイズの規則を知らないからというものであろう.しかしこの規則自体はそれほど難しいものではないので,ベイズの規則を知らないことだけが問題なのであれば,第2章で行なったようなややくだけた説明でも,その知識を伝える教示の機能を果たすであろう.もっとフォーマルな解説を望む人には統計的意思決定理論の教科書もある(例えば,松原, 1977, など).しかし,規則を知っていてもそれを使う条件が整っていないことがありうる.その一はベイズの規則の適用に必要な計算処理が意思決定者の認知システムにとって難しい場合である.その二はデータないし判断の場面の性質がベイズの規則を使うための条件をみたさない場合である.例えば,データ間の独立性の仮定がみたされないことは,現実には頻繁に起こり得るわけで,このときにはベイズの規則をそのまま使うことはできない.さらに第三の場合として,ベイズの規則が納得しがたい結果を導くためその結果が,あるいは規則そのものが,受け入れられないことが考えられる.
それならどうしたら人間にあたかもベイズの規則のように振舞わせることができるだろうか.ベイズの規則をなんらかの支援なしに使うことは人間の認知システムには難しいことがわかっているわけなので,第一番目の計算処理の問題を軽減することによって意思決定者を支援しようとするのが確率情報処理システムと呼ばれるデシジョン・エイドである.
すでにみたように,データに照らしていくつかの仮説のうちどれがどの程度確からしいかを知るには,仮説の事前確率と一連のデータ,そしてこれらのデータのひとつひとつに対応して,各仮説を条件としたそのデータの確からしさ(尤度)の判定が必要である.しかし,データが充分に得られる場合は,このうち事前確率は0や1に近い極端な値でない限り,事後確率にそれほどの影響を与えないことがわかっている.というのも,それぞれのデータが獲得されたときに得られる事後確率が,次のデータを処理する差異の事前確率になるからである.そこで最も重要な作業は新しく到着したデータのそれぞれの仮説に対する尤度を判定することである.しかもこの判定は相対的に行なえばよいことが理論的にわかっている.すなわち,2つの尤度の間の比(尤度比)
P(D|Hi) 「「「「「「「 , i≠j P(D|Hj)さえわかればよいのである.
データをもとに一群の仮説のそれぞれの確からしさを判定するのに,人間にそれを直接判定させず,かわりに尤度(比)を判定させて,そのうえでコンピュータに仮説の確からしさを計算させるという手順を繰り返したらどういうことになるだろう.エドウォーズをはじめ何人かの研究者がこの実験をシミュレーション事態を使って行なった.
実生活においては,実験室における意見の修正の研究のように事前確率,尤度,事後確率の正確さを,適当な基準に照らしてチェックすることは通常不可能である.それならどうしてPIPをデシジョン・エイドとして使うことを正当化できるか.エドウォーズら (Edwards, et al., 1968)の実験は,この問題にひとつの解答を与えようとするものであった.
(1)実験
エドウォーズらの扱った問題は政治軍事的な意思決定であった.まず意思決定者に近未来の世界の動きを歴史として教え込む.当時のこととて,この近未来は1984年ならぬ1975年である.この空想上の世界では6つの大国がしのぎを競っている.意思決定者は世界情勢に関する6つの仮説を与えられて(例えば,「ロシアがいままさにアラブ連合共和国を攻撃しようとしている」),その確率判断を行うよう教示をうける.判断の材料になるのは,偵察衛星,レーダー及び情報専門家からのデータである.60件の情報が次々に入ってくる.
(図4.2)被験者,すなわちこの場合意思決定者はいくつかの条件群に分かれていて,ひとつのグループはデータが与えられるたびに尤度を尤度比の形で評価するよう教示をうける(PIP条件).別のグループは仮説の事後確率あるいはその比(オッズ, odds)を直接評価するよう求められる(支援無し条件).エドウォーズらの研究の結果では,60件のデータの入手後,PIP条件のもとでもっとも確からしいと評価された仮説が,支援無し条件のもとでももっとも確からしいと評価された.両条件の違いと言えばPIPはこの最終的には両条件群一致で支持した仮説を支援無し条件群よりずっとはやく支持する結論に達した点で,この意味ではPIPははるかに優れていた.
エドウォーズらの実験はさらにまた,データの尤度比の判定のあと,コンピュータの計算した事後確率を意思決定者にフィードバックしてやると,結果はむしろベイズの規則から期待されるパターンからずれてしまうことを示した.意思決定者がPIPの現在の事後確率を勘定にいれて,判定のほうを修正してしまうためらしい.このときは人間機械系の行動は人間の主観的な事後確率の判定に引きずられて,支援無し条件の結果に近づくことになる.
(2)非独立なデータ
エドウォーズらの研究は相互に独立なデータが次々にえられる場合のみを扱ったもので,データ間に依存関係がある場合は考えていない.
ベイズの規則ではデータと仮説の間には依存性があるのが当然で,それを利用して仮説の確からしさの判断を修正しようというわけだが,データとデータとの間の関係は独立であることを前提としている.Aという情報員が本部に情報を送ってくる.Bという情報員はAの連絡を盗聴してそのまま自分の情報として本部に送ってくるとする.こうやってコピーされた情報がどんどん本部に送られてくるとき,本部側が自分のもっている仮説の評価をAの情報が示唆する方向に次々に修正してしまったらおかしなことになるのは自明であろう.
ドマスとピータースン(Domas & Peterson, 1972)は互いに非独立ないくつものデータを意見修正の材料に使うにはデータ自体を互いに独立になるようグループ化したほうがよいと示唆した.いったんグループ化してしまえば,これらのデータ群ごとの尤度と尤度比をPIPへの普通の入力のように扱うことができるというわけである.しかし一般にデータ間の独立性を確認することはむずかしいものと思われる.
(3)評価
PIPはコンピュータと人間をそれぞれの得意を生かして組合せ,効果と能率という評価規準の上では,意思決定者のみによるものにくらべて確率判断の修正が改善できる場合のあることをことを示した.
しかしPIPにはドマスたちが問題にしたようなデータの非独立性を警告する仕組みは組み込まれていない.あるいはせめて,データの非独立性が原因となってどんな都合の悪いことが起きるかが,意思決定者に容易にわかるような工夫がなされていれば,意思決定者の知識を生かしてよりよい判断をおこなう可能性が開けたはずである.この点では,PIPは人間から計算という機能を肩代りしただけで,その知能を増幅したとはいえない.
残念なことに1970年代のはじめ以降PIPについての報告は全く公開されなくなってしまった.1977年の時点で心理学の立場から意思決定研究を展望したスロヴィックらは,こうしたシステムはいったん実用化の見通しがたつとさまざまな理由から細部にわたっての公開が阻害され,意思決定者の側からの反応も発表されなくなってしまうと嘆いている(Slovic, et al., 1977).エクスパート・システムの利用者の立場での評価の報告がきわめて少ないことを考えると,こうした事情は今日でもそれほど変わっていないようである.
エドウォーズとともに初期からPIPの開発にたずさわっていたフィリップス(Phillips, L.D.)にPIPのその後を聞いたところ,PIPのアイデアは保険の引受業務の支援のシステムなどに生かされて健在だということだった.
上記のデータの独立性や,意思決定者にベイズの規則をよく理解してもらう助けにはならないことなどから,PIPの応用範囲は限られているが,コンピュータを利用したデシジョン・エイドのプロトタイプとして,ここであえて紹介した次第である.
当面のデータないし判断の場面の性質が,規範的理論に照らして,使おうとしている規則の適用条件をみたすかどうかあらかじめチェックしてから使うべきだという一見至極もっともな教示がある.しかし支援を最も必要としている意思決定者はこうしたチェックがあらかじめできるほど規範的理論そのものについての知識がないのが普通である.そこでこうした教示の実質的な効果は,意思決定者が規則を利用するのをためらわせることである場合が多い.
(1)精密検査の問題
次のような問題を考えてみていただきたい:
「ある街で緑病と青病という人命に関わる2つの病気が流行している.この街の病院にかつぎ込まれる患者の85%は緑病患者であり,15%が青病患者である.ある患者について精密検査をし,できうるかぎりの様々なテストをした結果,この人は青病患者であるという結論がでた.その精密検査による診断の識別力(信頼性)は80%だった.この信頼性は患者が青病であっても緑病であっても等しくなりたつものとする.さてこの患者が本当に青病にかかっている確率はどれくらいか.」
この問題を「精密検査の問題」と呼ぶことにする.精密検査の問題は,よく知られた「タクシーの問題」の変形である.実際にはタクシーを病気に,証人を精密検査にと,場面を置き換えたにすぎない.
タクシーの問題
「ある街でタクシーによる轢き逃げ事故があった.その街には2つのタクシー会社があり,それぞれ緑色のタクシーと青色のタクシーを運行させている.その街で走るタクシーの85%は緑色タクシーであり,15%が青色タクシーである.目撃者は,轢き逃げタクシーは青色タクシーであったと証言した.その時間帯のその場所でその証人の識別力をしらべたところ,緑色タクシーと青色タクシーのそれぞれに対し,つねにその80%は正しく識別できることが明らかであった.さて,事故を起こしたタクシーが証言通り本当に青色タクシーであった確率はどのぐらいか.」
タクシーの問題では数百人の被験者を使って実験した結果,回答の中央値および最尤値は約80%であった(Tversky and Kahneman, 1980)というが,ベイズの規則による精密検査の問題の「正解」は次のようなものである.
表4.1 (データ:精密検査の結果は青病) 事前確率 尤度 事前x尤度 事後確率 「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「 青病である H1 0.15 0.80 0.120 0.414 緑病である H2 0.85 0.20 0.170 0.586 「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「「 1.00 0.290 1.000表4.1から,精密検査の結果は80%の信頼性で青病であるにもかかわらず,青病の事後確率は41%余りに過ぎず,緑病の方がより確かであると考えるべきである.この結果は多くの解答者にとって納得のできない反直観的なものと感じられる.
(2)助言ヒューリスティック
筆者は「決定理論」の講義を受講する大学生数十名にベイズの規則を教えた後,タクシーの問題とその正解を説明した.そのあとで精密検査の問題を考えてもらい,問題の答え自体(事後確率値)はうえの教示からわかっているはずなので,むしろ,
1.なぜ41%という答えは(ある人々には)反直観的で納得しづらいのか,
2.どうしたら他人にその答えを納得させることができるか,
を回答させた.目的は,ベイズの規則と,精密検査の問題にこの規則を適用した場合の結論を,他人や自分自身に納得させるためにどんな助言ができるか,そのヒューリスティックをさぐることである..納得しづらい原因の把握は,このヒューリスティックの考案の前提になると思われるので同時に調べてみることにした.これまで知られているのは事前確率を無視する傾向である.
図4.3a,bは文章を多少整えた回答の一覧である.
(図4.3a) (図4.3b)問題の原因の表現の仕方も解決案も実にさまざまだが,自分自身どうしても納得できないという者もいる.
納得しづらい原因としては既に知られているように,事前確率を無視する傾向が,いろいろなバリエーションで指摘されている.このほかにめだつのは,精密検査の結果は青病であるというデータの,仮説「青病」に関する尤度 0.8の「小ささ」,あるいは仮説「緑病」に関する尤度 0.2の「大きさ」が十分に評価されていないという主旨の指摘である.
解決案に関しては,もっとていねいに順序を追って説明すればわかるはずだという前提の答えは比較的多く,おそらくひとつの頻繁に使われる助言ヒューリスティックを反映している.ベイズの理論をよく理解させ,その信頼性をあげ,納得させよ,よく理解させるには,うまく言葉で表現するか,値の出てくるプロセスを細かく説明する,そして慣習的な考え方から引き離すようつとめるのがよいというわけである.
こうした普遍的なヒューリスティックとならんで,この精密検査の問題事態の特殊な性質,例えば青病と緑病の流行の割合が85:15と(極端に)分かれていることなどを指摘しつつ説明するという方法も,比較的多くの支持をえている.
また1人で2つ以上の原因や解決案を提出した例が少なかったのも,めだった特徴である.
* 文献集 | * 文頭 | * 目次 | * 小橋ホーム |
URL=http://member.nifty.ne.jp/highway/dm/ b88-42.htm