人間関係や交渉を成功させる！応報戦略とは―ヒーローの心構えはしっぺ返しだ！

SNSでシェアする

この記事の目次

この記事で分かること
裏切りあいの構造―囚人のジレンマ
囚人のジレンマを制する戦略とは―アクセルロッドの研究
素直で・短気で・忘れっぽい―応報戦略で勝つ
反復囚人のジレンマを制するためのアドバイス
応報戦略の限界―残された裏切りあいの呪縛
参考文献

この記事で分かること

この記事を読むと、次のメリットが得られます。

人間関係や交渉に役立つ「応報戦略」が分かる
なぜ応報戦略が強いのか理論的に分かって応用できるようになる
応報戦略の限界が分かる

シンプルでありながら非常に強力な応報戦略を学んで、交渉に強くなりましょう！

裏切りあいの構造―囚人のジレンマ

協力したほうが良いと皆が分かっているにも関わらず、裏切りあいに陥ってしまう状況が存在します。

例えば、上司Aから仕事を任された部下B君が「上司Aは手柄を独り占めする人だから、最低限の仕上がりでゆっくりやればいいや」と考えており、上司Aは「部下Bはマジメに仕事しない人だから、重要な仕事は別の部下に回そう」と考えていたとしましょう。

本当は上司Aと部下Bが協力しあった方がいいわけです。上司Aは部下Bに重要な仕事を任せて成長させ、しっかり引っ張り上げてあげればいいし、部下Bは上司Aのために一生懸命働いて高いレベルの成果を出し、上司Aのさらなる出世に貢献すればいいのです。

しかし、「相手が協力的じゃないから」「相手が裏切るから」「自分だけバカを見ることになりそうだから」という相互不信から、お互いが相手を裏切りあう結末になってしまいます。上司Aは部下Bから低レベルの成果しか得られませんし、部下Bは成長の機会を得られず出世できません。

このように、お互いがお互いの首を締めあってしまう状況を、「囚人のジレンマ」といいます。囚人のジレンマの基礎は下記の記事で詳しく解説していますので、参考にしてください。

参考：協力か裏切りか！囚人のジレンマとは？―ビジネス社会心理学

囚人のジレンマを制する戦略とは―アクセルロッドの研究

囚人のジレンマ状況では、協力しあった方が得であるにも関わらず、目先の裏切りの利益に誘惑されて裏切りあいに陥ってしまい、最悪の結果になってしまいます。

そこで、囚人のジレンマを研究するゲーム理論や社会心理学では、「人々が協力しあい、最大の成果を得るためにはどうすべきか」について様々な研究蓄積がなされています。

そうして得られた知見の一つが、「囚人のジレンマが繰り返される場合には、人々が協力し合う可能性がある」というものです。

政治学者のロバート・アクセルロッドによる有名な「コンピューター選手権」の研究をご紹介しましょう。

アクセルロッドは囚人のジレンマ状況で最も有利になる戦略を調べるために、世界中の有名なゲーム理論家に手紙を出して、「囚人のジレンマ選手権」への参加を誘いました。

「最強の名をかけて闘えッ！」というわけで、天下一武道会かギャラクシアンウォーズ的な、漢らしい研究ですね。

この囚人のジレンマ選手権では、どんな場面で「協力」を選択し、どんな場面で「裏切り」を選択するかという「戦略」をコンピューターのプログラムにして、コンピューターシュミレーションで「戦略」たちに囚人のジレンマゲームを闘わせます。

この選手権の囚人のジレンマゲームでは、お互いに「協力」の手をだせばお互いに3点獲得となりますが、お互いに「裏切り」をすればお互いに1点しか得られません。また、片方が「協力」でもう片方が「裏切り」の場合、「裏切り」の手を出した戦略は5点を獲得し、「協力」したほうは0点獲得です。

こうして戦略たちに総当たり戦を闘ってもらい、最大の総合得点を記録した戦略が優勝というわけです。

さて、アクセルロッドの誘いに応じて、著名な14人のゲーム理論家がトーナメントに参加することに同意しました。彼らは自分が最良だと思う戦略をコンピューターのプログラムにしてアクセルロッドに送りました。

こうして集まった14の戦略プログラムに、ランダムに「協力」「裏切り」を出す戦略を加えた15の戦略が選手権の参加者となります。

それぞれの戦略は自分自身も含めた15の戦略を相手にして、各200回の繰り返しのある囚人のジレンマゲームを闘いました。

その結果、最大の得点を獲得した戦略は、参加したプログラムの中で最も短いシンプルな戦略でした。

それが、トロント大学のアナトール・ラポポート教授が応募した「しっぺ返し戦略（TFT: Tit For Tat）」です。

ラポポートのしっぺ返し戦略は、最初の回は「協力」の手を出し、次の回からは前回相手が出してきた手をそのまま繰り返すという戦略です。

たったこれだけの規則の戦略が、ゲーム理論家たちが練り上げた複雑なプログラムをも打ち破り、囚人のジレンマ選手権の優勝に輝いたのです。

アクセルロッドはこの選手権の詳細を報告し、その後「第二回囚人のジレンマ選手権」を開催しました。今度は6カ国から62名が参加し、前回の優勝者がしっぺ返し戦略だったという事実を踏まえて、自慢の戦略プログラムで参戦しました。しっぺ返し戦略をベースに改良を加えた戦略も多数集まりました。

しかしながら、この第2回の囚人のジレンマ選手権でも、誰一人として元のシンプルなしっぺ返し戦略を打ち負かすことができず、しっぺ返し戦略が2連覇する結果となったのです。

素直で・短気で・忘れっぽい―応報戦略で勝つ

しっぺ返し戦略は、専門的には「応報戦略」と言います。アクセルロッドの囚人のジレンマ選手権で優勝した応報戦略は、具体的にどう優れていたのでしょうか？

アクセルロッド自身は、応報戦略に限らず、全体として高得点をあげた参加者と低い得点の参加者との命運を分けたのは「素直さ（nice）」であったと言います。

自分からは決して裏切ろうとしない上品で素直な戦略が、第1回選手権の15の戦略のうち、上位8つを占めていました。

素直な戦略同士が囚人のジレンマゲームを行うと、どちらも自分から裏切ろうとしないために「協力：協力」という望ましい関係を構築することができ、200回の対戦でお互いに高得点を上げることができました。

したがって、素直な戦略たちの間で順位の差が生じたのは、素直ではない戦略との試合で何点とることができたかにかかってきます。特に重要だったのは、発案者にちなんで「ダウニング（DOWNING）」と呼ばれる狡猾な戦略との対戦成績でした。

ダウニングは人間を被験者にした囚人のジレンマ実験の観察結果をもとに考案された複雑な戦略で、簡単に言えば「相手の行動原理を理解し、相手の次の手を読むことで長期的に最大の得点を稼ぐ戦略」と言えます。こちらの手に応じて相手が何の手を出してくるのかを観察し、もし相手が常に「協力」を選ぶようなお人好しであれば徹底的に「裏切り」を行って搾取しますし、相手が反撃してくるタイプであれば猫をかぶって「協力」を出すようになります。

こうしたダウニングの性質から、あまりに「寛容」すぎる戦略はカモられてしまい、得点を伸ばすことができなかったのです。対して応報戦略は、前回相手が裏切れば、すぐ次の回で報復に出る「短気」な性格です。これが、姑息な相手と出会ったときに身を守ることにつながりました。

そしてもう一つ。おおむね好成績を収めた素直な戦略たちの間に差が生まれた第二の理由が、「忘れっぽさ」でした。

素直な戦略の中で一番低い成績だったのは、「フリードマン（FREEDMAN）」と名付けられた戦略でした。フリードマンは、自分から裏切ることはしないものの、相手が一回でも裏切るとそれを決して許さず、最後まで自分も裏切り続けるという執念深い戦略です。

このような執念深い戦略同士が対戦すると、相手が「様子見」や「できごころ」で裏切りを選択した場合に、裏切りあいの報復合戦が始まってしまいます。結果としてその対戦ではお互いに得点を伸ばせません。例えば上述の「ダウニング」は初手で「裏切り」を出して様子見を行いますが、「フリードマン」はこれを許さないため、ダウニングとフリードマンの間に協力関係が芽生えることはありません。

これに対して、応報戦略は1つ前の相手の手を繰り返しているだけですので、2手以上前のことは忘れてしまっている「忘れっぽい」戦略です。しかしこの性格のおかげで、初手で裏切りを行ったダウニングを許し、報復合戦を回避して協力関係を築くことができるのです。

以上のように、応報戦略は「素直で・短気で・忘れっぽい」性格であったために、有効的な戦略と協力しあい、ずる賢い戦略からは身を守り、囚人のジレンマ選手権を2連覇することができたのです。

ところで、この「素直で・短気で・忘れっぽい」性格は王道少年マンガの主人公のような性格であるといえるでしょう。ONE PIECEのルフィ船長やドラゴンボールZの孫悟空などが思い浮かびます。

もしルフィ船長がナヨナヨしたお人好しで、仲間のために怒る気概をもっていなければ、ライバルの海賊団に搾取されておしまいです。あるいは孫悟空が執念深い性格だったら、最初は敵だったベジータと協力関係を築くことができず、魔人ブウのような強敵の前に敗れ去ってしまうでしょう。

そして何より、彼らが素直で気持ちのいい性格であるからこそ、彼らの周りには優秀な仲間が集まって、強固な協力のネットワークを築いているのではないでしょうか。

良好な人間関係を築き、交渉という勝負の場面でも成功する、ヒーローの心構えは「しっぺ返し」にあったのです。

反復囚人のジレンマを制するためのアドバイス

アクセルロッドは応報戦略のコンピューターシミュレーションにおける活躍を踏まえて、実際に反復囚人のジレンマゲームの渦中におかれた人のために4つのアドバイスを提出しています。

目先の相手を羨まないこと
自分の方から先に裏切らないこと
相手の出方が協調であれ裏切りであれ、そのとおり相手にお返しをすること
策に溺れないこと

この4つのアドバイスを守ることで、反復囚人のジレンマゲームを上手く制することができるといいます。

第一のアドバイスは、「目先の相手を羨まないこと」です。

実のところ、アクセルロッドの囚人のジレンマ選手権では、応報戦略は目先の相手よりも高い得点をあげたことは一度もありませんでした。ただ、「平均してどんな相手に対してもそこそこ上手くやった」ために、最後には最高の総合点を得ることができたのです。

応報戦略が目先の相手より高得点をあげることは論理的に不可能です。最初に裏切ってくるのは常に相手の方であり、しかも応報戦略が裏切る回数が相手より多くなることはありませんから、応報戦略の得点は相手と同じか、少し低い点数に収まることになります。応報戦略は、長期的な観点で、様々な相手との取引したときに、得点を最大化しようという戦略なのです。

ここを理解せず、「相手の利益は自分の損だ」とばかりに、目先の相手の方が得点を稼ぐことに嫉妬して応報戦略を放棄してはいけないのです（本当に相手の利益が自分の損になっているゼロサムゲームの場合、それは囚人のジレンマではないので本稿の理論は当てはまりませんが）。自分から裏切ってしまえば、結局は報復合戦の引き金を引いてしまうことになります。

そこでアクセルロッドは、「目先の相手と比べて自分の利益がどうか」を基準にするのではなく、「他の誰かが自分と同じ立場に立ったとき、どれくらいうまくやるか」を基準に考えて自分の状況を評価することを提案しています。

今の自分と同じ相手に対して、平均的なプレイヤーであればどれくらいの成果を出すかという「標準得点」のようなものを見積もって、それと今の自分のパフォーマンスとを比較すれば、相手の利益を基準にせずにすむというわけです。

アドバイスの2つ目は、「自分から相手を裏切らないこと」です。

アクセルロッドの囚人のジレンマ選手権で上位を占めたのは軒並み「素直な」戦略でした。

たまに自分から裏切って相手の出方を試すような戦略は、その「魔が差した」一手が報復合戦の引き金を引いてしまい、高い成績を出すことができなかったのです。

アドバイスの3つ目は「相手の出方が協調であれ裏切りであれ、そのとおり相手にお返しをすること」です。

応報戦略の「相手の手を出し返す」この性質は、非常に優れた防御機構になっています。常に裏切ってくる相手にはこちらも常に裏切りで応じ、まれに裏切ってくる相手にはこちらもそれなりの裏切りで応じるというように、自動的に相手に合わせた制裁を加えることになるのです。

相手が一度裏切れば決して許さない「フリードマン」のような執念深い戦略が良い成績を出せなかったことを思い出してください。

アドバイスの4つ目は「策に溺れないこと」です。

「チャンスを伺って少しでも搾取してやろう」「全体的には協力的にふるまって、ちょくちょく裏切ってやろう」といったように、策を弄することは長期的にパフォーマンスを低下させます。

策を弄することの最大のデメリットは、それが相手の態度を変え、協力的な関係を壊してしまうことにあります。アクセルロッドの囚人のジレンマ選手権では、策を弄する戦略は報復合戦の引き金を引くことを通じて、お互いの得点を下げてしまいました。

戦略の複雑さは、そのパフォーマンスの高さを保証するものではないのです。

応報戦略の限界―残された裏切りあいの呪縛

ここまで、「素直で・短気で・忘れっぽい」性格の応報戦略がいかに優れた戦略であるかを見てきました。

私たちが直面する人間関係や交渉の場面においても、「自分からは裏切らず」「協力的な相手にはしっかり協力し」「裏切ってきたら確実にやり返し」「しかし許すことも忘れない」という態度をとれば、負け無しのプレイヤーになれそうです。

しかしながら、実は応報戦略には限界が存在することも知られています。

まず第一に、「反復囚人のジレンマゲーム」でなければ応報戦略は通用しません。見ず知らずの相手と一発勝負を行う場合には、素直な応報戦略が「協力」を出す一方で相手が「裏切り」で搾取してきても、やり返す機会が無いために丸損して終わってしまいます。長期間に及ぶ安定的な関係性がなければ、応報戦略は活かせません。

第二に、「協力し合うことで得られる将来の利益」が不十分であれば、応報戦略で協力関係を築くことができません。応報戦略の強さの秘訣は、長期的な反復取引を前提として「お前が裏切ったら、確実にやり返すぞ」と強気の態度を示している点にあります。

この態度を見た利己主義者が「確実にやり返されたら、目先の勝負で少し儲けるよりも、協力してやって長期的に大儲けしたほうがいいな」と考えを改めるからこそ、応報戦略は強いのです。もしここで、「将来の利益は大したことないから、やっぱり目先の勝負で搾取しよう」と利己主義者が考えてしまえば、応報戦略といえども不毛な裏切りあいに引き込まれてしまいます。

第三の応報戦略の限界は、ずる賢い戦略しかいない環境では勝ち目がないという点です。勝負する相手が全員「裏切り」しか出さない世界にたった一人で応報戦略が入り込んでいっても、最初に「協力」を出す応報戦略はカモにされてしまいます。ある程度は「素直な」戦略が生存している環境でなければ、応報戦略はずる賢い戦略より高得点を出すことができません。

第四の応報戦略の限界は、「ノイズのある世界」では応報戦略は厳しすぎるという点です。現実世界では、相手が協力してくれたのか、裏切ってきたのか、必ずしも明確ではありません。お互いに勘違いや誤解がつきものです。状況が複雑で相手が「協力」してくれたのか「裏切り」をしてきたのか判然としない場合もあります。あるいは、協力しようと思っていたのに不可抗力や第三者の介入で、結果として偶然「裏切り」のようになってしまうこともあるでしょう。

コンピューターシュミレーション上でも、偶然のミスや不慮の事故、勘違いなど「ノイズのある世界」で応報戦略を闘わせたところ、相手が協力してくれていても誤解に基づいて応報戦略はすぐに反撃してしまい、裏切りあいの負の連鎖の引き金を引いてしまう傾向が観察されています。ノイズのある世界では、「2回までは裏切りを許す」ような、もう少し寛容な応報戦略の方が、パフォーマンスが高いことが多いようです。

外部サイト：Kollock（1993）”An Eye for an Eye Leaves Everyone Blind”: Cooperation and Accounting Systems

そして応報戦略の限界の五つ目は、「社会的ジレンマ」状況では通用しないという点です。

囚人のジレンマは1対1の勝負です。これを複数人対複数人の勝負に拡張した概念が「社会的ジレンマ」です。社会的ジレンマ状況には、例えば環境問題のように、「裏切ったやつは利益を独り占め」「裏切りによって発生したコストは皆で分担」という構造があります。

参考：北斗の拳で分かる！社会的ジレンマとは―現代人は「悪党共」に勝利できるか？

このため、社会的ジレンマ状況では応報戦略による「裏切り者に対するやり返し」ができません。制裁のダメージを裏切った張本人にだけ負担させることができず、協力的なプレイヤーも含めた「社会全体」に分散してしまうからです。裏切り者は応報戦略による反撃の心配をすることなく、堂々と裏切り続けることができるというわけです。

応報戦略が最高のパフォーマンスを発揮できるのは、「繰り返しのある1対1の勝負」に限られています。

以上、ここまで応報戦略の限界を確認してきました。確かに強力な応報戦略ですが、現実世界では通用しない場面も多そうです。応報戦略の使い所をしっかり見極めなければいけません。

では、結局のところ私たちは囚人のジレンマを克服し、協力的な関係を築くことはできないのでしょうか？

さらなる回答を探して、別の記事で戦略の深みを追求していきましょう。