やられたらやり返さずに逃げるのが一番？ – 囚人のジレンマが教える相手とうまく付き合う方法

人はなぜ協力できるのか？

人はなぜお互いに協力しあうのでしょうか？一見あたりまえすぎる問いですが、その答えは容易ではありません。協力するというのは実は、自分が何らかのコストや犠牲を伴って相手に利益を与える行動です。厳しい生存競争のなかで無条件に協力していては、協力する人はやがて淘汰されてしまうはずです。

それでも人間社会は有史以来、見知らぬ者同士であってすら、これまで協力し合うことでこの社会の繁栄をもたらしてきました。人間だけでなく動物社会においても、さらには粘菌のような単純な生物種においても利他的な協力行動は観察されます。つまり、淘汰されないように協力しあっているからには、うまい仕掛けが必要なのです。

囚人のジレンマと協力の進化

協力行動の本質的な特徴を理論的に分析するために、研究者はしばしば「囚人のジレンマ」というシンプルな枠組みを考えます。これは2人の共犯者が捕まってしまい、それぞれ自白か黙秘かを迫られた状況における共犯者の行動を扱っています。

2人とも協力して黙秘し続ければ罪が軽くなるにもかかわらず、自分だけ裏切って自白すると司法取引で無罪にしてもらえると検察官に言われたらどうなるでしょう。誘惑に負ければ「2人とも」自白します。すると司法取引が成立せず、その罪で収監されてしまいます。片方だけが黙秘を続ければ、最後まで口を割らなかったということで、最も重い罰を受けてしまいます。このとき囚人は、黙秘し続けることができるでしょうか？彼らが直面している心理的葛藤（＝ジレンマ）は、協力するかしないかという問題を考えるうえで絶妙な事例になっています。

囚人のジレンマは、次のように簡潔なゲームで記述することができます。2人のプレイヤーがゲームをする場面を考えます。プレイヤーは「協力」か「非協力」の2つの行動を選ぶことができます。協力するためにはコスト $c$ がかかりますが、相手に $b(b>c)$ の利得を与えることができます。お互いに協力すると $b-c$ というプラスの利得が得られますが、自分だけ協力して相手が非協力だと、自分は $-c$ 、相手は $+b$ の利得となり大損します。結果2人とも非協力で0の利得しか得られなくなってしまいます。先の例だと協力が黙秘、自白が非協力に相当します。この状況で得られる利得は下図のようにまとめられます。

囚人のジレンマ状況で如何にすれば相互の協力が可能になるのかという問題は人類にとってとても大切な課題で、経済学・政治学・心理学・生物学・物理学など、幅広い分野で研究されてきました。そこで得られた答えのひとつが「同じ相手と繰り返しゲームをプレイする環境であること」です。

同じ相手とプレイすることで、前回相手が非協力だったら今回自分も非協力をとる、相手が前回協力だったら自分も協力するといった行動戦略が可能になります。前回の相手と自分の行動それぞれの組み合わせで行動を決める場合、前回の行動の組み合わせ4通りそれぞれに協力・非協力の2つの行動があるので2⁴=16通りの戦略が存在します。

「参加しない」という行動の導入

これまでの多くの研究では人がとる行動は「協力」「非協力」の2択でした。つまり、必ずゲームに参加して手を選んでいました。しかし、そもそもゲームに参加しないという行動も考えられます。いつも相手が非協力だからしばらく付き合いを様子見するという具合です。

ゲームに参加しないという行動は2000年代に入り盛んに研究されるようになりましたが、どのような戦略が有利なのかについての研究は未開拓の問題として残っていました。なぜなら前回の相手と自分の行動の組み合わせで行動を決める場合、前回の行動の組合せが9通りあり、それぞれに対して3つの行動があるので3⁹=19683通りもの戦略を考える必要が生じるからです。

さらに考えるべき問題としてゲームの構造があります。囚人のジレンマでは、将棋や囲碁のように自分と相手が交互に行動を決める「逐次手番ゲーム」と、じゃんけんのように双方同時に行動を決める「同時手番ゲーム」が存在します。「協力」「非協力」の2択の囚人のジレンマにおいてもゲーム構造によって有利な戦略が異なることが明らかになっていますが、「参加しない」という行動が導入されたときのゲーム構造の影響はやはり未開拓のテーマでした。

どんな戦略が生き残るのか？

今回の私たちの研究では、「参加しない」という新たな選択肢を加えた囚人のジレンマでどのような戦略が生き残るのか、そもそも相互協力は進化するのか、という問いに計算機シミュレーションを用いて答えています。

約2万の戦略が混在する環境をコンピュータ内で実現し、そのなかでより有利な戦略が子孫を増やすという仕組みを実装した進化計算という手法を用いました。さらに、2万もの戦略が存在するなかでどの戦略が生き残ったかを視覚化することも重要な課題になるため、新たな視覚化手法を開発し結果を直観的に理解できるように工夫しました。

ではシミュレーションの結果どんな戦略が生き残ったのでしょうか。やられたらやり返すのか？逃げる（参加しない）のか？下図はその答えをまとめています。

囲碁・将棋タイプの逐次手番ゲームでは、前回自分が協力したのに相手が非協力だった場合、つまり搾取されたときは、今回は逃げる（参加しない）を選択し、また相手が前回逃げた場合は今回自分は協力を選ぶ戦略が支配的になりました。つまり「搾取されたら逃げる、逃げられたら協力する」という戦略によって相互協力を実現しているのです。

また詳細に分析すると、ほとんどの場面で非協力という行動を使うことはありませんでした。ゲームに参加しないという行動が可能であれば、やり返すという行動を使うことなく相互協力を実現できています。

一方ジャンケンのような同時手番ゲームでは様相が異なります。前回搾取されたときには非協力が支配的になっています。また、自分が搾取に成功したときにも非協力を選びます。つまり「搾取されたり自分が搾取できた場合は非協力」という行動が支配的です。前回相手が参加しなかった場合も全般的に非協力行動が支配的になります。

両方のゲーム構造においても相互協力が成立しているあいだは協力をとり続けるのですが、何らかの理由で協力関係が壊れたときに関係を修復する過程に大きな違いが見られます。

多様な人々の相互協力にむけて

「人はなぜ互いに協力するのか」という一見するとごく当たり前の問いのなかにも、学問の未知の平原が広がっていることを実感していただけたでしょうか。今回の論文は「同じ相手と繰り返し付き合う」という環境を想定しています。では同じ相手とは1回しかやり取りしないとしたらどうなるでしょうか。インターネット上の取引のように、匿名性が高く人の流動性も高い環境ではどのような仕組みが必要となるでしょうか。ますます国境のボーダレス化が進む世界で異なる価値観の人々のあいだで相互協力を実現するためには我々は何をすべきでしょう。協力の進化という研究分野には今後の人類が取り組むべき重要な課題が数多く溢れています。多くの人たちにこの分野の研究に関心を持ってもらえることを願っています。

参考文献
H. Yamamoto, I. Okada, T. Taguchi, and M. Muto “Effect of voluntary participation on an alternating and a simultaneous prisoner’s dilemma” Physical Review E, 100, 032304 (2019) https://doi.org/10.1103/PhysRevE.100.032304

この記事を書いた人

山本仁志: 東京理科大学助手、電気通信大学大学院助手を経て、現在立正大学経営学部教授。2003年電気通信大学にて博士（工学）取得。
協力の進化、社会的ジレンマ、社会シミュレーション、ソーシャルメディア分析を中心に研究しています。ミクロな相互作用過程がマクロ的現象を生み出すメカニズムに興味を持っています。
http://hitoshi.isslab.org/

この投稿者の最近の記事

研究成果2019.10.15やられたらやり返さずに逃げるのが一番？ – 囚人のジレンマが教える相手とうまく付き合う方法

やられたらやり返さずに逃げるのが一番？ – 囚人のジレンマが教える相手とうまく付き合う方法

人はなぜ協力できるのか？

囚人のジレンマと協力の進化

「参加しない」という行動の導入

どんな戦略が生き残るのか？

多様な人々の相互協力にむけて

この記事を書いた人

この投稿者の最近の記事

Related Posts

俳句の美は変化のなかに宿る？―連続測定で明らかになった感情と認知のプロセス

俳句の曖昧さを楽しむのは「熟達者」だけ？- 熟達者と初心者の鑑賞の違いを探る

自由記述でもこころを分析できる？- 心理学調査の先端で「曖昧さ」に挑む