ナッシュ均衡の存在定理
前回、アイとノノの簡単なゲームに角谷が適用できるということを説明しましたが、プレーヤーと戦略の数が増えても角谷の定理は使えます。 そしてこのことが角谷を応用してナッシュの定理を証明するということなのです。
3人の囚人のジレンマを考えましょう。 戦略は協調する確率だけで表わされるので、 戦略の組み合わせは (p, q, r) と書くことができます。 このゲームのナッシュ均衡は (p, q, r) = (0, 0, 0) です。 (裏切りが支配戦略なので。) いま3人の戦略の組み合わせ (p, q, r) に対し、最適反応の組み合わせを返す関数をFとします。(ここでの最適反応とは他の2人の戦略の組に対するものです。たとえば (q, r) = (1, 1) に対しては p=0 が最適反応。) Fには
(1, 1, 0) → (0, 0, 0)
などの対応があります。(いちおう形式的に確認してみてください。) こういうときでも角谷の定理はそのまま何も考えずに適用できて、Fには不動点があることが言えます。じっさい (0, 0, 0) が不動点になります。
つぎにアイとノノのじゃんけんゲームを考えてみましょう。
アイとノノの戦略の組み合わせは (p1, p2, q1, q2) と書くことができます。(パーの比率は自動的に決まるので。ただし p1+p2≦1, q1+q2≦1 です。) このゲームのナッシュ均衡は階段じゃんけんで計算したように (p1, p2, q1, q2) = (2/8, 5/8, 2/8, 5/8) です。 いまアイとノノの戦略の組み合わせ (p1, p2, q1, q2) に対し、最適反応の組み合わせを返す関数をFとします。 たとえばFには
(1, 0, 0, 0) → (0, 1, 0, 0)
などの対応があります。(また確認してみてください。たすきがけの要領です。) こういう関数でも角谷の定理はやはりそのまま適用できて、Fには不動点があることが言えます。じっさい (2/8, 5/8, 2/8, 5/8) が不動点になります。 ( (2/8, 5/8, 2/8, 5/8) ∈ ([0, 1], [0, 1], [0, 1], [0, 1]) )
最後に3人がそれぞれ同じ3つの戦略 L, C, R をもつゲームを考えてみましょう。 たとえば L, C, R は3人の待ち合わせ場所だとします。 3人の戦略の組み合わせは (p1, p2, q1, q2, r1, r2) と書くことができます。 (たとえばp1はプレーヤー1がLをとる確率。ただし p1+p2≦1, q1+q2≦1, r1+r2≦1 です。) そしてこれに最適反応の組み合わせを返す関数をFとすると、 Fには
(1, 0, 1, 0, 1, 0) → (1, 0, 1, 0, 1, 0)
などの対応があります。(any は [0, 1] の意味。) 待ち合わせなので同じ戦略をとるのがいいのです。また他の2人がバラバラなら、どこに行っても同じです。 3×3ゲームでも角谷の定理は無条件に使えて、Fには不動点があることが言えます。じっさい (1, 0, 1, 0, 1, 0) などが不動点になります。
このように複数プレーヤー・複数戦略のゲームにも 角谷の不動点定理があてはまるわけです。 詳しい説明は難しいのでここではしませんが、 ナッシュの定理の条件<有限プレーヤー・有限戦略>というのは つねに角谷の条件<コンパクト凸・連続>を満たすのです。 それゆえナッシュの定理は角谷の定理を使って証明できるのです。 全6回にわたりましたが、以上でナッシュ均衡と不動点定理(Kakutani)の関係は つかめてもらえたと思います。 最後に角谷の不動点定理を正式な形で書いておきます。
◆参考文献
|