おうむ返し


すでに紹介した「囚人のジレンマ」は1回きりのゲームでした。 ではこのゲームを何回も繰り返したらどうなるだろう、というのがいわゆる「繰り返し型囚人のジレンマ」です。

ここに2人の姉妹、マナとカナがいます。2人は毎週日曜日の朝に部屋の掃除をするのが決まりになっています。2人で協力すると30分で終わりますが、2人ともサボると2時間かかってしまいます。一方が頑張って一方が怠けると、1時間かかります。 2人の効用はつぎのテーブルで表されます。

a, b, c, d はマナの選好順位を表しています。 すなわちマナは自分が怠けてカナが頑張るというのがいちばんよいので左下のマスが a になります。その逆が最悪なので d 、2位 b は協力して30分で終わること、3位 c がいっしょに怠けて2時間かかることです。 (選好順位を明確にしたのは、効用の大きさとかかる時間をはっきり区別するためです。効用の大きさは選好順位になりますが、かかる時間の大きさは選好順位になりません。)

このゲームが「囚人のジレンマ」であることはすぐにわかります。 ともに怠けるのが絶対優位の戦略なので、均衡は c(1, 1) になります。

しかし、ちょっとまってください。2人は毎週毎週サボって、2時間も掃除をするのでしょうか?マナカナはきっと賢いですから、だいたい毎週協力して30分で終わりそうな気がしませんか?たぶんその方が自然だとおもいます。そういう自然さに近づいていく過程で用いられるのが「おうむ返し」と呼ばれる戦略です。

姉のマナの戦略を考えていきましょう。

マナが「常に協調する」戦略をとるとします。するとカナはいつもサボってくるでしょう。 でもいつも自分だけ損をするというのはあまりにも馬鹿げています。だから何か別の方法を考えるでしょう。

そこでマナは、「次の週はいつも、前の週妹がやったことと同じことをする」という戦略をとることにします。つまり「おうむ返し」戦略です。 ある週、妹のカナがサボったとします。この場合は、マナは次の週、仕返しとしてサボります。カナが協調してきたとしましょう。この場合は、マナは次の週も協調します。するといずれカナは、自分がサボると姉もサボる、でも協調すれば姉も協調してくれる、ということに気付くでしょう。カナはサボったり頑張ったりするより、長期的に見ればいつも協調したほうがいい(平均利得が上がる)んじゃないかと考えます。

「おうむ返し」はまず協調することから始めます。自分からは裏切らない上品な戦略です。 自分から良い関係を壊して、やっかいな状況を作ったりはしません。お姉さんとしてはぜひ使ってほしい戦略です。カナは裏切りに対するおうむ返しをされてはじめて、協調したほうが得だということを「学習」します。そうしてカナが学習し、次から協調してくれば、マナは喜んで協調します。こうして「2人で協力する」という良い関係が築かれていくわけです。どうですか、「おうむ返し」はよい戦略でしょう?

繰り返し型囚人のジレンマが1回きりの囚人のジレンマと違うところは 「将来への配慮」があるかどうかということです。将来への配慮があるならば、そこでの協調を確かなものにするために、今協調しておく、というのは合理的だと考えられます。 1回だけの囚人のジレンマは「裏切ってあたりまえ」でした。しかし「繰り返し型」では 将来へ配慮するのが長期的に見て得策だということです。われわれが普段、日常生活や仕事の中でやっているのは「繰り返し型」の方です。小学校で毎日昼休みの後にやるクラスの掃除にしても、長年の付き合いがある取引先との関係にしてもそうです。 人間関係が狭ければ狭いほど、長ければ長いほど、「繰り返し型」である度合いが強くなります。また繰り返し型囚人のジレンマは自然界における協調行動にも見られ、その協調行動は「進化論的に安定した戦略」といわれます。

さて、この経験的に正しいと考えられてきた「おうむ返し」戦略を、コンピューターを使って証明した学者がいます。アクセルロッドという政治学者で、それが「アクセルロッドの実験」とよばれるものです。


★インターネットと一発勝負の取引

ジョージ・ソロスも『グローバル資本主義の危機』の中で個人的自己利益と集団の共通利益について繰り返し述べています。囚人のジレンマを引き合いに出している箇所があるのでそれを紹介します。

(第4章) ・・・ 市場メカニズムが動くその動き方にも、微妙で穏やかではあるが 、それでいて重要な変化が起こりつつある。まず第一に、長期にわたって築き上げられた関係が、今や一発勝負の取引にとって代わられている。店主と顧客が顔見知りであった雑貨屋はスーパーマーケットや、ごく最近ではインターネットの軍門に下ってしまった。

(中略) 個別取引とコネ取引の相違点については、いわゆる囚人のジレンマという形のゲームの理論によって詳しく分析されている。(中略) 個別取引の場合は、裏切るほうが理に適っているが、永続的な関係の場合は、信義を守った方が引き合うのである。 この分析は、時の経過とともに協力関係が発展する可能性を示していると同時に、 一発勝負の取引が永続的な関係の座を奪うことによって、いかに協力と信義とが 損なわれるかを示す例としても使うことができる。



◆参考文献

  • 『囚人のジレンマ―フォン・ノイマンとゲームの理論』 
    ウィリアム・パウンドストーン、青土社、1995年 
    PRISONER'S DILEMMA : JON VON NEUMANN, GAME THEORY, AND THE PUZZLE OF THE BOMB (1992) 

◆参考サイト
CyberEconomics
http://ingrimayne.saintjoe.edu/econ/