隠居日録

隠居日録

2016年(世にいう平成28年)、発作的に会社を辞め、隠居生活に入る。日々を読書と散歩に費やす

「意思決定」の科学 なぜ、それを選ぶのか

川越敏司氏の「意思決定」の科学 なぜ、それを選ぶのかを読んだ。本書はジョン・フォン・ノイマンとオスカー・モルゲンシュタインの「ゲームの理論と経済行動」から発展した意思決定理論に関して平易に解説した本である。

何かを選択するときに、合理的に(あるいは利益が大きくなる、損失が小さくなるなど)選択をしたいと思うのが人情であるが、では合理的とは一体何かということを考えさせられる本だった。

サンクトペテルブルクパラドックス

次のようなゲームについて考察する。

偏りのない公平なコインを表が出るまで投げ続ける。この時、k回目に初めて表が出たら2^k(単位は100円)の賞金がもらえる。

今このゲームに参加する権利を無償で手に入れ、手元にある場合、これを他人に売るならば、いくらで売るべきだろうか?たいてい、こういう物を見た時は、まずゲームによって得られる賞金の期待値を見積もるだろう。このゲームの場合n回目に初めて表が出る確率は1/2^nとなり、その時の賞金は2^nとなる。この二つの積は1になるので、期待値は1を無限に加えることになり、無限大になる。では、このゲームの参加権を無限大の価格で売ろうとしても、まず買い手がつかないだろう。理論上は無限の試行回数がありうるが、現実にはそんなに裏が連続することはないだろうから、高々数回試行するになるだろう。なので、参加権の金額としては数百円というのが妥当な線になりそうだ。これは期待値の計算には間違いがないのだが、計算される期待値と我々が直観的に感じるゲームの価値には乖離があるため無限大の金額にはならないのだ。

このパラドックスはダニエル・ベルヌーイがサンクトペテルブルグ科学アカデミーに滞在している時に思いついたので、サンクトペテルブルクパラドックスと呼ばれている。ベルヌーイはこの問題を解消するために、「効用」という考えを提唱した。「効用」とは受け取った利益(あるいは損失)に対するゲーム参加者の主観的な満足(あるいは不満)の程度を表す指標である。この指標は当然人によって異なる。一般にお金を多く持っている人は、同じ金額を得ることに対して感じる効用の増加分を少なく感じる。つまり、1つ持っている人がもう1つ得た時の満足感と100持っている人が更に1つ得た時の満足感は、前者の方が大きく、後者は小さいだろう。今平方根を考えると、この状況をある程度表していることがわかる(実際には何らなの定数とか係数が必要だろうがここでは単純化のためにあえて考慮しない)。このような関数を効用関数と呼ぶ。そして、次に効用関数を用いて効用の期待値である期待効用を最初のゲームに関して計算する。同様にn回目の確率(1/2^n)の時の効用は\sqrt(2^n)なので、この総和を考えると、\sum_{n=1}^\infty \frac{1}{2^n} * \sqrt{2^n}となり、この値は約2.414になるので、金額は2.414*2.414*100となり、約583円(少数第一位で四捨五入)となる。だいたいこれぐらいの金額がふさわしいのではないだろうか?

アレのパラドックス

以下のような2つのくじAとBがある。

くじA
100%の確率で1万円が得られる。
くじB
10%の確率で5万円、89%の確率で1万円が得られるが、1%の確率で何も得られない。

この2つのくじのうち、どちらかを無償で得られるとするとき、どちらが欲しいか?

また、次のようなくじCとDがある。

くじC
11%の確率で1万円が得られるが、89%の確率で何も得られない。
くじD
10%の確率で5万円得られるが、90%の確率で何も得られない。

この2つのくじのうち、どちらかを無償で得られるとするとき、どちらが欲しいか?

この実験は1953年にモーリス・アレという経済学者が発表した実験課題だ。どのように選択するかは個人によって異なるだろうが、くじAとくじDを選択するのではないだろうか?今ここで期待効用を計算する。賞金額x円からえられる効用を表す効用関するをu(x)と表すことにすると、A~Dの期待効用はそれぞれ以下のようになる。

Aの期待効用
1.0 \cdot u(1万円)
Bの期待効用
0.1 \cdot u(5万円) + 0.89 \cdot u(1万円)
Cの期待効用
0.11 \cdot u(1万円)
Dの期待効用
0.1 \cdot u(5万円)

Aを選んだということはAの期待効用がBより大きくなることを意味している。1.0 \cdot u(1万円) > 0.1 \cdot u(5万円) + 0.89 \cdot u(1万円)が成り立ち、整理すると、0.11 \cdot u(1万円) > 0.1 \cdot u(5万円))となる。同様にDを選んだということは、Dの期待効用がCより大きいということになる。0.1 \cdot u(5万円) > 0.11 \cdot u(1万円)。この2つの関係式を見ると、不等号の向きが逆になっていることがわかる。これは矛盾している。
なぜこのような矛盾が起きるかについては本書に書かれているが、単純に言うと、期待効用理論の3つの公理(順序公理、連続性公理、独立性公理)のうち独立性公理が必ずしも正しくないからだという。そこで、アレは期待効用理論から独立性の公理を取り除いたプロスペクト理論を提唱した。そして、この矛盾を解消するために、賞金が当たる確率に重みづけをするw(p)を導入して計算する。この重みづけ関数は元の確率pが小さい場合はpよりw(p)は大きくなり、元の確率pが大きいときはw(p)はpより小さな値をとるような特徴がある。具体的には確率がpのときw(p)=\frac{p^λ}{(p^λ+(1-p)^λ)^{1/λ}}で定義され、λは定数で0 \le λ \le 1の値をとる。実はこの重みづけ関数は、リスクのある状況において、人々は小さな確立を過大に評価し、大きな確立を過少に評価するということに対応している。

正誤表

残念なことにこの本には多数の誤植がある。その一覧は以下にあるので、本を読む際の参考にした方がいいだろう。
「意思決定」の科学 - ブルーバックスシリーズの特設ページ