죄수의 딜레마

“묵비권을 행사할 수 있는 두 명의 용의자를 죄수의 딜레마 상황으로 몰면 결국은 둘 다 자백하게 된다.” 형사의 심문 기술인 것 같습니다. 하지만 죄수의 딜레마는 용의자의 딜레마, 용의자의 고민, 수감자의 딜레마라고도 불리는 경제 이론 중의 하나입니다.

PC나 모바일 전략 게임에서 상대방의 전략을 예상하고 자신의 전략을 정하는 것처럼 상대방의 전략을 고려 하지 않을 수 없는 상황에서 개인은 어떤 선택을 하는 지를 살펴 보는 이론이 죄수의 딜레마입니다.

공유자원의 남용이나 카르텔이 오래 유지 되기 힘든 것처럼 협조가 어려운 이유, 자원이 효율적으로 배분되지 못하는 상황을 설명하기 위해 이용되는데요, 죄수의 딜레마 상황은 그 자체로 흥미롭습니다.

각자에게 가장 유리한 전략이 따로 있는데, 그걸 선택하지 못하는 상황이 벌어지니까요.

죄수의 딜레마란?

딜레마(dilemma)란 무엇을 선택해야 하는 지 또는 어떤 행동을 해야 할 지 결정하기 어려운 상황을 말합니다. 그렇다면 죄수의 딜레마는 죄수가 처한 어려운 상황이라고 볼 수 있겠네요. 대체 어떤 상황이기에 딜레마라고 하는 지 두 명의 용의자 A와 B가 처한 상황을 한 번 보겠습니다.

두 명의 용의자(A와 B)가 편의점을 털다가 현장에서 검거 되었습니다. 경찰은 이들이 1년 전 다른 편의점도 털었으며 범행 와중에 살인을 저질렀음도 알고 있습니다. 다만, 증거를 확보하지는 못했습니다.

A와 B가 현장에서 붙잡힌 범행만 인정할 경우 형량은 대략 2년 정도가 예상됩니다. 살인을 했던 범행까지 인정하면 대략 20년 형을 선고받을 것으로 예상됩니다. 경찰에게 증거가 없다는 것을 알고 있는 A와 B 입장에서 최선의 전략은 현장에서 검거된 범행에 대해서만 인정하고 살인에 대해서는 부인하거나 묵비권을 행사하는 것이겠지요.

살인죄로 기소를 해도 증거가 없으니 이들은 가벼운 강도 혐의만 인정되어 2년 형만 받을 가능성이 높아졌습니다. 흠…, 그래서는 안 되겠겠지요. 우리나라에는 없는 제도이지만 검찰이 형량 협상(deal)을 할 수 있다면 죄수의 딜레마 상황을 만들어 이들을 높은 형을 받도록 할 수 있습니다. 바로 다음과 같이 협상을 하는 것입니다.

A와B를 서로 다른 취조실로 분리하여 서로 의사소통을 할 수 없게 만든 후 A에게 다음과 같은 제안을 합니다.

  • 이봐 A. 살인한 사실을 빨리 자백하시오. B가 묵비권을 행사하고 있는데 당신이 자백하면 B는 25년 형을 받고 당신은 1년 형만 받도록 해주겠소.
  • 만약 당신이 묵비권을 계속 행사하는 상태에서 B가 자백을 하면 반대로 B가 1년 형을 당신은 25년 형을 받게 될 것이오.

B에게도 위와 같은 제안을 합니다. (위 문장에서 A를 B로 B를 A로 바꾸어 제안을 합니다.) A와B는 이제 죄수의 딜레마 상황에 빠졌습니다. 자신에게 유리한 최선의 선택을 해야 합니다.

죄수의 딜레마 보상행렬

지금까지의 상황을 하나의 표로 나타내면 아래와 같습니다.

죄수의 딜레마 보상행렬

위와 같은 표를 보상행렬(payoff matrix)이라고 하는데요, 죄수의 딜레마 상황에 처한 당사자의 우월 젼략이 무엇인지 알아 보는데 유용합니다.

우월 전략(dominant strategy)은 상대방이 어떤 전략을 선택하든 나에게 항상 유리한 전략인데요, 모든 게임 이론에 우월 전략이 존재 하는 것은 아니지만 죄수의 딜레마 상황은 우월 전략이 항상 존재 합니다.

A의 우월 전략은 보상 행렬을 가로로 보면서 각 셀에 있는 위쪽 대각선에 있는 결과를 비교하면 되고, B의 우월 전략은 보상 행렬을 세로로 보면서 각 셀에 있는 아래쪽 대각선에 있는 결과를 보면 됩니다.

용의자 A의 우월 전략

B가 어떤 선택을 하는 지에 따라 A의 최선의 전략을 정리해 보면 다음과 같습니다.

  • B가 묵비권을 행사할 경우 A가 자백을 하면 1년, 묵비권을 행사 하면 20년 형이니, 자백 하는 것이 유리합니다.
  • B가 자백할 때 A가 자백을 하면 20년 형을 받게 될 것아고 묵비권을 행사하면 25년 형을 받게 되니, 자백하는 것이 유리합니다.

B가 자백을 하던 묵비권을 행사하는 전략을 선택하든 A는 자백하는 전략을 선택하는 것이 유리하다는 것을 알 수 있죠. A의 우월 전략은 자백입니다.

용의자 B의 우월 전략

B 역시 A가 했던 것처럼 상대방이 어떤 전략을 선택하는 지를 예상 한 후 그에 맞추어 유리한 전략을 결정하면 됩니다.

상대방 A가 묵비권을 행사할 경우 B가 묵비권을 행사하면 2년, 자백을 하면 형량을 1년만 받을 수 있게 됩니다. A가 자백을 하는 경우에는 B도 자백을 해야 형량을 줄일 수 있습니다.

A가 묵비권 전략을 선택하든 자백 전략을 선택하든 B 역시 자백 하는 것이 유리합니다. B의 우월 전략 역시 자백입니다.

죄수의 딜레마 결과

A와 B가 사전에 입을 맞추고 살인에 대해 자백하지 않는 전략으로 서로 협조 했다면 2년 형의 선고만 받았을 것입니다.

그러나 서로가 (다른 최조실로 분리됨으로써) 무슨 전략을 선택할 지 알 수 없게 되자 자백 하는 것이 우월 전략인 상황으로 몰리게 됩니다. 2년 형을 받을 수 있었던 것을 20년 형을 받게 되는 결과가 됩니다.

이처럼 죄수의 딜레마는 서로 협조를 한다면 최선의 결과를 얻을 수 있지만, 협조 하는 것이 쉽지 않음을 보여 줍니다.

교도소

죄수의 딜레마 사례

공유자원의 남용

남용할 것인지 사용을 줄일 것인지를 상대방의 선택에 따라 따져 보면 경제적인 측면에서의 우월 전략은 남용 하는 것입니다.

공동체 전체로는 서로 협조하여 사용 시간을 줄여야 좀 더 오래 사용할 수 있지만, 각자의 우월 전략인 남용을 선택함으로써 자원 소멸과 같은 비극적 상황을 초래하는 경우가 있습니다.

석유 수출국 기구(OPEC)와 같은 카르텔에서 협정이 잘 지켜 지지 않는 것

협정을 깨고 석유 생산을 더 하거나 가격을 내려 판매를 더 하는 것이 OPEC에 속한 회원국의 우월 전략이기 때문에 생산 협정이나 가격 협정이 종종 깨지곤 합니다.

한 회원국이 협정을 깨고 나면 다른 회원국도 협정을 깰 것이기 때문에 결국의 가격 폭락이라는 (판매자 입장에서) 손해를 보는 경우도 있습니다.

군비 경쟁

냉전시대 미국과 소련(현재 러시아)의 군비 경쟁도 죄수의 딜레마 사례로 볼 수 있습니다. 상대 나라가 군비를 축소 하든 군비를 확장하든 우월 전략은 군비 확장이기 때문입니다.

냉전 시대의 군비 경쟁은 소련이 더 이상 군비 확장을 경제적으로 감당하기 힘들어 졌을 때 멈출 수 있었습니다.

리니언시(leniency) 제도

죄수의 딜레마 상황은 일종의 시장 실패 상황이라고 앞에서 알아 보았는데요, 역으로 시장 실패 상황을 깨뜨리기 위해 죄수의 딜레마 상황을 만들 수도 있습니다.

기업들이 가격 담합을 하여 소비자 가격을 높게 유지 하는 경우 정부에서는 리니언시 제도 를 도입하여 가격 담합을 깨뜨릴 수 있습니다.

리니언시 제도는 가격 담합을 한 사실을 신고하는 기업에게 과징금을 면제하거나 줄여 주는 제도입니다.

기업들 입장에서는 가격 담합을 한 사실을 절대로 들키지 않을 자신이 있다면 신고 하지 않겠지만, 혹시라도 그 사실이 드러날 가능성이 있다면 신고 하는 것이 우월 전략이 되어 결과적으로 가격 담합이 깨지게 됩니다.

죄수의 딜레마의 의미

죄수의 딜레마는 각 개인이 최선의 선택을 했을 때 공동체 전체로는 최선의 선택이 되지 않을 수도 있음을 보여 줍니다.

용의자 A와B를 공동체라고 본다면 공동체로서의 최선의 선택은 둘 다 묵비권을 행사함으로써 각자 2년 형을 받는 것이지만, 각자가 각자의 최선을 추구하다 보니 둘 다 20년 형을 받는 것처럼 말입니다.

경제학적인 의미로 풀어 보면 각 개인의 사적 이익 추구 행위의 결과가 효율적 자원 배분으로 귀결되지 않을 수 있음을 보여 줍니다. 공유자원의 남용처럼 시장 실패의 한 예로 볼 수도 있습니다.

사회적인 의미로 보면 바람직한 결과를 낳는 경우도 있고 그렇지 않은 경우도 있습니다.

공유자원이 남용되는 경우나 군비 경쟁은 바람직하지 않은 결과를 낳지만, 죄수의 딜레마 사례는 최선은 아니지만 최악은 피할 수 있다는 점에서 바람직하다고 볼 수 있습니다.

죄수의 딜레마는 같은 상황이 반복되면 더 이상 딜레마가 아니게 될 수도 있습니다 . 앞의 예에서 용의자 A와 B가 여러 번 반복해서 같은 상황에 처하게 된다면 나중에는 둘 다 묵비권을 행사할 수도 있을 것입니다.

A와 B가 동등한 관계가 아닐 때도 죄수의 딜레마는 성립하지 않습니다. A와 B가 보스와 행동대원 수준의 상하관계라면 행동대원은 보스를 배반하기 어려을 것이고 보스는 행동대원이 어떤 경우에도 여죄를 자백하지 않을 것을 알고 있을 것이기 때문입니다.

용의자 A와 B가 반복해서 같은 상황에 처한 다는 것은 다소 비현실적인 가정이지만, 군비경쟁과 같은 사례는 반복적인 상황을 통해 죄수의 딜레마가 극복되는 것을 설명해 줍니다. 미국과 구소련의 예에서 볼 수 있는 것처럼 반복적인 군비경쟁이 서로에게 득이 되지 않는다는 것을 알게 되어 마침내는 군비 축소 합의를 할 수 있었으니까요.