チャーミーの挑戦3  


「チャーミーの挑戦2」の設定を少しだけ変えてみましょう。チャーミーはセクシーの行動をみたあとに行動できるとしてみるのです。

セクシー セクシー
VS
チャーミー チャーミー

いま、新しいゲームはつぎのツリーで表現できるとします。

まず自然が 1/3 の確率で High Cost 、 2/3 の確率で Low Cost を選びます。 自然の行動をみたあとでセクシーは Expand か Don't Expand を選びます。 セクシーの行動をみたあとでチャーミーは Enter か Stay Out を決めます。 ここでチャーミーはセクシーのタイプがわからないので、線で結んでいます。 たとえば、セクシーが Expand を選ぶのを観察したとしても、それが High Cost のセクシーなのか Low Cost のセクシーなのかわからないのです。

さてこのゲームでは、<セクシーは High Cost なら Don't Expand 、 Low Cost なら Expand という戦略をとり、いっぽうのチャーミーはもし Expand を観察したなら Stay Out 、もし Don't Expand を観察したなら Enter をとる>という戦略の組はベイズ完全均衡になることがわかります。

いま、セクシーは High Cost なら Don't Expand 、 Low Cost なら Expand という戦略をとっているとします。するとチャーミーの合理的な信念というのは、情報集合 A では (High: 0, Low: 1) であり、 情報集合 B では (High: 1, Low: 0) です。 この信念のもとでのチャーミーの最適な行動を考えましょう。 するとチャーミーの情報集合 A での Stay Out は最適になっています。(期待利得 -1*0+(-1)*1=-1 と 0 を比較する。)いっぽう情報集合 B での Enter は最適になっています。(期待利得 1*1+1*0=1 と 0 を比較する。)よってこの信念のもとではチャーミーの (Stay Out - Enter) は最適になっています。

では逆にチャーミーが (Stay Out - Enter) という戦略をとっているとしましょう。 するとセクシーが High タイプならDon't Expand 、 Low タイプなら Expand をとるのは最適反応になっています。

こうして戦略の組 (セクシー, チャーミー) = (Don't Expand - Expand , Stay Out - Enter) および信念 {Expand: ( High: 0, Low: 1), Don't Expand: ( High: 1, Low: 0)} はベイズ完全均衡を構成することがわかります。


「サプライズ・ギフト」で見た「セパレーティング均衡」「プーリング均衡」もじつは ベイズ完全均衡です。

WOODY vs BUZZ

case1: c > 2 の場合 セパレーティング均衡

いまバズの (Don't Challenge - Challenge) を前提とすると、ウッディの合理的な信念は (0, 1) です。そこで Retreat は最適になっています。(期待利得 1*0+(-2)*1=-2 と 0 を比較する。)逆にウッディの Retreat を前提とするとバズの (Don't Challenge - Challenge) は最適になっています。

case2: c < 2 の場合 プーリング均衡

いまバズの (Challenge - Challenge) を前提とすると、ウッディの合理的な信念は (w, 1-w) です。そこで w < 2/3 とすると Retreat は最適になります。(期待利得 1w-2(1-w)= 3w-2 < 0 と 0 を比較する。)逆にウッディの Retreat を前提とするとバズの (Challenge - Challenge) は最適になっています。


◆参考文献

  • GAME THEORY WITH ECONOMIC APPLICATIONS 
    Scott Bierman, Luis Fernandez, Addison-Wesley, 1998 

  • GAMES OF STRATEGY 
    Avinash K. Dixit, Susan Skeath, W. W. Norton & Co, 1999