期待利得  


5. 期待利得

  • J で S1 に属する純粋戦略の数、 K で S2 に属する純粋戦略の数を示す。 S1 = { s11 ,・・・, s1J } , S2 = { s21 ,・・・, s2K } として、 s1j , s2k でそれぞれ S1 , S2 に属する任意の純粋戦略を指す。

  • もしプレーヤー1が、プレーヤー2は戦略 (s21 ,・・・, s2K) を 確率 (p21 ,・・・, p2K) で選択すると予想すれば、 プレーヤー1が純粋戦略 s1j を選ぶことによって得る期待利得は

     

    と書ける。

  • また、プレーヤー1が混合戦略 p1 = (p11 ,・・・, p1J ) を選べば、プレーヤー1の期待利得は

    となる。

  • 同様にして、 プレーヤー2の期待利得は

    となる。


ノノ
アイ

  • J=2, K=2 のときを考えます。 アイの戦略集合を S1 、ノノの戦略集合を S2 とします。 S1 = { s11 , s12 } , S2 = { s21 , s22 } として、 s1j , s2k でそれぞれ S1 , S2 に属する任意の純粋戦略を指します。

  • もしアイが、ノノは戦略 (s21 , s22) を 確率 (p21 , p22) で選択すると予想すれば、 アイが純粋戦略 s1j を選ぶことによって得る期待利得は どうなるでしょう。

    これは、たとえば j=1 のときは、 アイが s11 を選んだときの期待利得ということなので、  p21*8 + p22*0 になります。これは

    p21 u1 (s11 , s21) + p22 u1 (s11 , s22)

    ということです。

    j=2 のときは、 s12 を選んだときの期待利得なので p21*0 + p22*6 です。 これは

    p21 u1 (s12 , s21) + p22 u1 (s12 , s22)

    です。

    結局アイが s1j をとったときの期待利得は

    p21 u1 (s1j , s21) + p22 u1 (s1j , s22)

    で、これは

     

    と書けます。

    ノノ
    アイ

  • いま、アイが混合戦略 p1 = (p11 , p12 ) を選ぶとします。 するとアイの期待利得は 

    p11(s11をとったときの期待利得) + p12 (s12をとったときの期待利得)

    なので、

    p11 ( p21 u1 (s11 , s21) + p22 u1 (s11 , s22) ) +
    p12 ( p21 u1 (s12 , s21) + p22 u1 (s12 , s22) )

    です。これは、

    p11(p21*8 + p22*0)+ p12(p21*0 + p22*6)
    = p11p21*8 + p11p22*0 + p12p21*0 + p12p22*6

    のことで、結局アイが混合戦略 p1 、ノノが混合戦略 p2 をとったときのアイの期待利得は

    と書けます。式は (j, k) = (1, 1), (1, 2), (2, 1), (2, 2) で和をとるという意味です。

    v1 (p1 , p2) =
    p11 * p21 u1 (s11 , s21) +
    p11 * p22 u1 (s11 , s22) +
    p12 * p21 u1 (s12 , s21) +
    p12 * p22 u1 (s12 , s22)

  • 同様に考えてノノの期待利得は

    v2 (p1 , p2) =
    p11 * p21 u2 (s11 , s21) +
    p11 * p22 u2 (s11 , s22) +
    p12 * p21 u2 (s12 , s21) +
    p12 * p22 u2 (s12 , s22)

    です。


    ◆参考文献

    • 『経済学のためのゲーム理論入門』 
      ロバート・ギボンズ、創文社、1995年
      GAME THEORY FOR APPLIED ECONOMISTS (1992)