そろそろ答えを発表します
単純に考えてエンゼル君のほうが多く取れると思う人もいますが、
大間違いです。
結論から言えばデビル君のほうが多く取れます。
>>8の利得表で考えてみます。
まず、デビル君の行動から考えます。
エンゼル君がボタンを押しに行く場合
自分(デビル君)も一緒に行くと
+40に対し、待っていれば
+80の利得になります。
エンゼル君が待っている場合
自分(デビル君)がボタンを押しに行くと
-10に対し、待っていれば0になります。
なお、このようにどの選択を選んでも有利になる選択はゲーム理論用語で
支配戦略と呼ぶ。
よって、デビル君は必ず待ちます。
一方エンゼル君はデビル君が必ず待つことが分かっているため、
自分がそのまま待ってしまうと利得0に対し、ボタンを押しに行けば
+10の利得が得られます。
よって、デビル君が80枚のコインを取り、エンゼル君は20枚しか取れません。
このように、二人が最適な反応を取る事をゲーム理論用語で
ナッシュ均衡と呼びます。
なお、自然界でもこのような現象が起こっています。
すべてが弱肉強食でないと言うことですね
では、二人とも足が遅いと仮定すると利得は下のようになる。
A行く D行く (
+40,
+40)
A行く D待つ (
-10,
+100)
A待つ D行く (
+100,
-10)
A待つ D待つ (0,0)
この場合、二人とも「待つ」が
支配戦略となるので、(待つ、待つ)が
ナッシュ均衡です。
しかし、よく見ると二人とも「待つ」よりも「行く」場合の方が利得が高いことが分かります。
よって、ナッシュ均衡=最善とは限りません。
ゲーム理論に興味を持った方は、wikipedhiaから勉強してから、本を購入してみると
人生の勉強になりますよ。
エンゼル 2009/01/07 17:54
単純に考えてエンゼル君のほうが多く取れると思う人もいますが、
大間違いです。
結論から言えばデビル君のほうが多く取れます。>>8の利得表で考えてみます。
まず、デビル君の行動から考えます。
エンゼル君がボタンを押しに行く場合
自分(デビル君)も一緒に行くと+40に対し、待っていれば+80の利得になります。
エンゼル君が待っている場合
自分(デビル君)がボタンを押しに行くと-10に対し、待っていれば0になります。
なお、このようにどの選択を選んでも有利になる選択はゲーム理論用語で支配戦略と呼ぶ。
よって、デビル君は必ず待ちます。
一方エンゼル君はデビル君が必ず待つことが分かっているため、
自分がそのまま待ってしまうと利得0に対し、ボタンを押しに行けば+10の利得が得られます。
よって、デビル君が80枚のコインを取り、エンゼル君は20枚しか取れません。
このように、二人が最適な反応を取る事をゲーム理論用語でナッシュ均衡と呼びます。
なお、自然界でもこのような現象が起こっています。
すべてが弱肉強食でないと言うことですね
では、二人とも足が遅いと仮定すると利得は下のようになる。
A行く D行く (+40,+40)
A行く D待つ (-10,+100)
A待つ D行く (+100,-10)
A待つ D待つ (0,0)
この場合、二人とも「待つ」が支配戦略となるので、(待つ、待つ)がナッシュ均衡です。
しかし、よく見ると二人とも「待つ」よりも「行く」場合の方が利得が高いことが分かります。
よって、ナッシュ均衡=最善とは限りません。
ゲーム理論に興味を持った方は、wikipedhiaから勉強してから、本を購入してみると人生の勉強になりますよ。