改善のジレンマ~ゲーム理論から学ぶ改善の勘所

改善活動がうまくいかない様がゲーム理論の「囚人のジレンマ」に似ていると感じたところから考えを整理してみました。異論は認める。どんとこい。

はじめに

勉強会に参加すると「職場の環境を改善したい」という意思を持っている人は結構見かけます。しかし「自分のチームが最高になりました」という話はなかなか聞きません。理想に近づくために改善活動を頑張っているのに、状況は一向に改善しない。自分は凄く頑張っているのに自分の周りは改善されない。頑張っているのに報われない、悩みを持っている人たちを多く見かけます。

その頑張っているのに報われない様をゲーム理論における「囚人のジレンマ」になぞり、問題の整理と改善のヒントを見つけることが今回の目的になります。

囚人のジレンマ

囚人のジレンマ」とは個人が自身にとって最適な選択を取ったとして、必ずしも全体最適にならない例のことです。

  • 共犯で重い罪を犯した二人が別件で逮捕された。警官が二人を別々の場所に隔離して取り調べを行い、それぞれに「もし相手が黙秘し、お前が重罪を自白したのなら無罪にしよう。」と取引を持ち出した。一方が黙秘し、もう一方が自白した場合、黙秘したほうは懲役10年、自白したほうは無罪となる。二人とも黙秘した場合は別件逮捕の件で懲役1年、二人とも自白した場合はともに懲役5年となる。

二人の囚人をそれぞれA,Bとします。囚人A,Bの懲役期間の表は以下のようになります。

囚人A\囚人B 黙秘 自白
黙秘 (-1,-1) (-10,0)
自白 (0,-10) (-5,-5)

仮に囚人Bが黙秘した場合は自身も黙秘すれば懲役1年、自身が自白すれば無罪になり、囚人Aにとって自白したほうが有利になります。囚人Bが自白した場合は自身が黙秘すれば懲役10年、自白すれば懲役5年となり、囚人Aにとって自白したほうが有利になります。つまり囚人Bの黙秘/自白に関わらず、「自白」することが囚人Aにとって最善の結果になります。
囚人Bにとっても同様に、囚人Aの黙秘/自白に関わらず、「自白」することが囚人Bにとって最善の結果になります。
そのため、各々が自身にとって最適な結果は「両方とも自白する」ことになります。
しかし、「両方とも自白する」ことにより共に懲役5年になるのに対し、「両方とも黙秘する」ことで懲役1年になるため、協力して「両方とも黙秘する」方が囚人にとって良い結果になります。

改善のジレンマ

改善活動を囚人のジレンマになぞって、以下のように仮定します。

  • 職場の環境に不満をもった二人の社員がいます。一方が改善活動をし、もう一方が改善活動をしなかった場合、改善活動をしたほうは改善効果より労力が勝るためマイナス、改善活動をしなかったほうは労せず改善効果が得られたためプラスとなる。二人とも改善活動をした場合はともに労力以上の改善効果がえられるためプラス、二人とも改善活動をしなかった場合は変化なしとなる。

二人の社員をそれぞれA,Bとします。社員A,Bの損得の表は以下のようになります。

社員A\社員B 改善活動する 改善活動しない
改善活動する (3,3) (-2,5)
改善活動しない (5,-2) (0,0)


社員Bが改善活動をする/しないに関わらず、社員Aにとっては「改善活動をしない」が最善手になります。同様に社員Bにとっても社員Aが改善活動をする/しないに関わらず、「改善活動をしない」が最善手になります。つまり、改善活動はしない方が良い、という結論になります!

...そんな訳ないですね。
協力して改善活動をする(3,3)ほうが、二人とも改善活動をしない(0,0)ことに比べて良い結果となります。しかし、個人レベルで見た場合は「改善活動をしない」ほうが相手の選択に関わらず良い結果となります。
この考えをもとに、あなたが改善活動をしていてもあなた以外が改善活動をしてくれないことを、ここでは「改善のジレンマ*1」と呼びます。あなた以外にとっては改善活動をしないほうが最も得をする選択なので、改善活動をしないのです。あなたはあなた以外が協力して改善活動をしてくれないことに憤りを感じることがあるかもしれません。しかし、あなた以外に悪意があるかどうかは関係なく、改善活動をしないのは自然なことなのです。

繰り返しゲーム

上記の「囚人のジレンマ」は1回だけのゲームを想定していますが、現実では同様のシチュエーションは何度も何度も訪れます。ここでは、時間経過と長期的な関係を扱う「繰り返しゲーム」を元に「改善のジレンマ」の対応策を検討します。

有限回の繰り返しゲーム

ゲームの回数が決まっている、有限回の繰り返しゲームについて整理します。T回の囚人のジレンマを繰り返し行ったときに、どのように行動すればよいかを考えます。結論からいうとT回の囚人のジレンマを行った場合、各囚人にとって「全ての回で自白する」ことが最適解になります。

  • 各囚人は最後のT回目のゲームでは過去にどんな選択をしたかに限らずに最適な行動である「自白」する行動をとります。
  • (T-1)回目のゲームでは、T回目のゲームを予想した上で、過去にどんな選択をしたかに限らずに最適な行動である「自白」する行動をとります。
  • ... (以下、1回目まで続く)

このように帰納的に考えることで、各囚人は「自白」する選択を取り続けることになります。
このことから改善のジレンマにおいても「改善活動をしない」ことを続けることが最善手になります。…いいのかコレ?

無限回の繰り返しゲーム

ゲームの回数が決まっている「有限回の繰り返しゲーム」では、協力を達成できません。しかし、恒常的な作業が「T回で終わる」という感覚をもっている人はほとんどいないと思います。改善活動などは「終わりがない」と考えている人がほとんどの筈です。そのため、より現実の感覚に近いゲームである「無限回の繰り返しゲーム」を元に「改善のジレンマ」の対応策を考えていきます。

「無限回の繰り返しゲーム」では、「有限回の繰り返しゲーム」のように一番最後のゲームから考えることができません。そのため、将来どのような結果になるかを予想する必要があります。その際、「将来得られる価値をどのように考えるか」によって結果が変わります。囚人のジレンマを例にして整理します。

  • ある囚人の「将来得られる価値」が「今得られる価値」より十分に低い場合、協力して「黙認」し続けることによる価値が低いため、現在の最適回が得られる「自白」することを選択します。
  • ある囚人の「将来得られる価値」が「今得られる価値」とほとんど変わらない場合、協力して「黙認」し続けることにより将来的に大きな価値が見込めるため、(戦略によっては)「黙認」することを選択します。

このことから、「将来得られる価値を重視する長期的な視野を持つもの同士なら協力を達成できる」と言えます。

改善の勘所

「無限回の繰り返しゲーム」では、「長期的な視野を持つプレイヤー同士」なら「協力が達成できる」とあります。つまり、「あなた以外が改善活動をする」ためには、「あなたが改善活動をする」だけではなく、「あなた以外が改善活動によって得られる将来的な価値を重要視しているか」を確認する必要があります。

つまり、改善のために何より必要なことは「あなたが改善活動を続けること」ではなく、「あなた以外と改善活動の価値を共有しつづけること」になります。改善活動の価値が共有できていないのであれば、あなたが改善活動を続けたところであなた以外は改善活動をしてくれないですし、そのことに嫌気がさしてあなた自身の改善活動が止まってしまうかもしれません。

おわりに

前の記事でかいた1項目「アンチパターン?:個人の問題を技術で解決する」に対する考察になります。
同じことに価値を感じ続けられるチームが作れたらどれだけ嬉しいことだろう、と考えながら書きました。
那須のチームに対して、何が羨ましいと思うのか - toshimana's diary

今回はゲーム理論のなかでも「囚人のジレンマ」について取り上げましたが、ほかにもゲーム理論には面白い話がたくさんあるので、それと改善との対応を整理してみるのも面白いかと思います。

参考文献

以下の文献を参考にしました。「囚人のジレンマ」や「繰り返しゲーム」の話はこちらの文献を元にしています。内容を簡単にするためにゲーム理論については詳細な説明を省いているところがありますので、細かく知りたい方は勉強してみてください。

ゼミナール ゲーム理論入門

ゼミナール ゲーム理論入門

*1:この記事でのみ使っている造語です