ナッシュ均衡


「合理的なハムスター」でナッシュ均衡という言葉が出てきました。 しかも、「ゲーム理論で均衡と言うとそれはナッシュ均衡のことである」 とも言っていました。

そういえば今までなんとなく「均衡」という言葉を使っていました。 「ゲームの予想される結果」とか「ゲームの落ち着くところ」 みたいなかんじでつかんでもらっていたとおもいます。

「囚人のジレンマ」「合理的なハムスター」 では「絶対優位の戦略」という考え方、 「階段じゃんけん」「テニスのかけひき」 では「ミックス戦略」という 考え方を用いてゲームを解きました。 しかしこれらのゲームの解には 何か共通するものがあるような気がします。 それは、 これらのゲームの解は

相手の戦略に対してお互いが最善を尽くしている状況

であるということです。

たしかに「囚人のジレンマ」では、ゲームが落ち着くところでは、 AはBの戦略(裏切り)に対してベストの戦略(裏切り)をとっていました。 BもまたAの戦略(裏切り)に対してベストの戦略(裏切り)をとっていました。 言い方をかえれば、 (裏切り, 裏切り) の組は「お互いに最適反応」ということです。 あるいは、AもBも「相手の戦略を前提にしたとき自分の戦略を変える誘因がない」ということです。AはBの裏切りを前提にしたとき裏切りから協調に変えても損するだけですし、 BもAの裏切りを前提にしたとき裏切りから協調に変えても損するだけです。

「合理的なハムスター」でも、 太郎はチビコの戦略(押さない)に対して ベストの戦略(押す)をとっていました。 チビコもまた太郎の戦略(押す)に対してベストの戦略(押さない)をとっていました。 すなわち (太郎, チビコ)=(押す, 押さない) の組は「お互いに最適反応」です。 太郎もチビコもこの戦略の組では自分だけ戦略を変えてみてもいいことがないです。 太郎は 0.5 を 0 にしようとはしませんし、チビコは 5 を 1.5 にしようとはしません。

そういえば「階段じゃんけん」「テニスのかけひき」でも お互いに最善の戦略になるところを考えていたとおもいます。 階段じゃんけんではお互いに 2:5:1 で出すときは、 お互いに戦略を変えてみても利得は上がりません。これはお互いに最適反応をしているということです。テニスのかけひきでも、相手のミックス戦略を前提にしたとき、自分の戦略を変えてみても期待利得を上げることはできません。サーバーとレシーバーの両方についてこれはいえます。 「トムとジェリー」でも共に真ん中に店を構えることがお互いに最適反応です。

ということはこれらのゲームはすべてこの「お互いに最適反応」という考え方で まとめることができるということです。統一的に考えることができるというのは何かと便利ではないですか? この考え方はナッシュという数学者が提案したので、 ナッシュ均衡と呼ばれます。

「相手の戦略に対してお互いが最善を尽くしている状況」というのは、 いいかえれば、自分だけ戦略を変えてみても何の得にもならないという状況です。 すると、お互いこの戦略から離れる誘因がないということなので、 この状況・状態は安定的だといえます。これが「均衡」の意味です。


★A BEAUTIFUL MIND 2001年11月

ナッシュの伝記 "A BEAUTIFUL MIND" (by Sylvia Nasar) が映画化。 今度のクリスマスに公開されます(米12都市)。

http://www.abeautifulmind.com/

| 関連記事等 | 

Princeton - Weekly Bulletin 12-10-01 (英語) 2001年12月
http://www.princeton.edu/pr/pwb/01/1210/1b.shtml

第59回ゴールデン・グローブ賞 2002年1月
http://www.zakzak.co.jp/midnight/hollywood/backnumber/G/020123-G.html

詳しい作品紹介(日本語) 2002年2月
http://www.eiga-portal.com/movie/abeautifulmind/01.shtml

第74回アカデミー賞 2002年3月
http://www.cnn.com/2002/SHOWBIZ/Movies/03/25/aa.oscar.night/index.html