눈에는 눈(Tit for Tat) - 하나

눈에는 눈(Tit for Tat) 전략은 여기서도 몇번 다뤄본 적이 있습니다. 로버트 액셀로드의 협력의 진화라는 책에 나와있는, 상대로부터 협력을 이끌어낼 수 있는 전략입니다.
특히나 리처드 도킨스도 이 책에 대해 깊은 감명을 받았다고 합니다. 스스로 서평을 자청하여 이런 내용을 적었더군요.

전 세계 정치 지도자들을 납치하여 골방에 가두고 이 책 한권씩 넣어둔 후, 이 책을 다 읽은 사람만 풀어주어야 한다.

그리고 자신의 저서에서도 이 눈에는 눈 전략을 여러번 언급합니다.

비협조적인 상대에게서 협력을 이끌어낼 수 있다는 것에서, 과학계 뿐 아니라 사회 이곳저곳에서 많이 인용되는 것도 사실이죠. 하지만 나비효과와 마찬가지로 이 팃포탯 전략 역시 오용되는 경우가 많은듯 합니다.

이 전략에 대한 오해에는 이런 것들이 있더군요.



협력배신
협력50100
배신-100


팃포탯 전략은 상대를 이기기 위한 전략이다? 천만에요.

팃포탯 전략을 사용하는 틱택이가 있습니다. 이 틱택이가 배신자와 게임을 하고 있습니다. 협력할 생각이 전혀 없는 배신자를 상대로 틱택이가 승리를 거둘 수 있을까요?

틱택이는 언제나처럼 [협력]부터 시작합니다. 배신자는 처음부터 [배신]을 합니다. 틱택이는 -10점, 배신자는 100점을 얻게 되겠죠.
이후 틱택이는 보복으로 배신을 하겠지만 배신자도 배신을 할 테니 둘 다 0점을 얻게 됩니다. 마찬가지로 배신자는 계속 배신을, 틱택이는 앞의 배신에 대한 응징으로 배신을 계속하게 됩니다. 처음 배신당했을 때의 110점 차이가 게임 끝날 때까지 계속되죠. 결국 틱택이는 110점 차이로 패배하게 됩니다.

그렇다면 틱택이가 순진한 협력자와 경기를 한다면 어떨까요? 둘은 처음부터 끝까지 똑같이 협력을 하며 똑같은 득점을 합니다.

즉 틱택이는 순진한 협력자조차 이기지 못하고 동점을 기록하며, 사기꾼을 만나면 근소한 차이(110점 차이)로 지게 됩니다. 틱택이는 상대가 누구든 비기는 것이 최선이며, 틱택이가 이길 수 있는 상대는 없습니다.

그런데 상대를 이길 수 없는데 어떻게 최고의 전략이 될 수 있을까요?

상대가 협력을 할 때는 틱택이는 같이 협력하며 점수를 쌓아올립니다.
상대가 배신을 시작하면 점수를 뺏기지만 그 이후부터 같이 배신하며 더이상 상대가 부당이득을 얻지 못하도록 합니다.

즉 팃포탯 전략은 상대를 이기기 위한 전략이 아니라 자신의 피해와 상대의 부당이득을 최소화하는 전략입니다. 사기꾼을 만났을 때는 사기꾼의 부당이득을 최소화시키며 지는 대신 다른 틱택이나 순진한 협력자와의 경기에서 높은 점수를 얻을 수 있습니다.
배신자는 순진한 협력자와의 경기에서는 더 높은 점수를 얻게 되지만 틱택이와의 경기에서는 110점밖에 얻지 못합니다. 더구나 다른 배신자와의 경기에서는 전혀 점수를 얻지 못합니다.

배신자의 배신에 질린 순진한 협력자가 퇴장한다면, 틱택이는 다른 틱택이와 함께 높은 점수를 얻을 수 있는 반면, 배신자는 점수를 얻을 방법이 사라지게 되는 것입니다. 이것이 아무도 이길 수 없는 틱택이가 결과적으로 이길 수 있는 이유입니다.


그러므로 [난 상대를 이기지 못하면 참을 수 없어]라든지 [저녀석이 이득을 얻는 꼴은 죽어도 못본다]라는 플레이어에게는 팃포탯이 적당하지 않습니다. 팃포탯은 지는 것을 각오하고 시작하는 전략 또는 전투에서는 지고 전쟁에서는 이기는 전략입니다.


팃포탯 전략은 배신에 대한 응징을 중요시한다? 2%가 아니라 50% 부족해요

틱택이가 사기꾼과 대결을 하고 있습니다. 예상대로 사기꾼은 연속 배신을 합니다.
틱택이는 최초의 배신에 의해 110점 뒤떨어지고, 그 이후 연속된 보복에 의해 서로 점수가 없는 소강상태가 지속되고 있습니다.

어라? 그런데 이번에 웬일로 사기꾼이 협력을 해 오네요?

자, 다음번 틱택이의 전략은 무엇일까요?

저놈은 그동안 계속 배신만 해왔어. 지금 협력을 내놓은 것도 뭔가 속이려 하고 있는 거야라 생각하며 보복(배신)을 계속해야 할까요, 아니면 저녀석이 이제 정신을 차린 모양이네. 드디어 협력 시작이다라며 협력을 재개해야 할까요?

팃포탯 전략은 기본적으로 상대의 선택을 되풀이한다입니다. 상대가 얼마나 오래 협력했든 이번에 배신했으면 배신으로 갚아주는 것처럼, 상대가 얼마나 오래 배신해 왔든 이번에 협력을 했으면 협력으로 응답하는 것, 즉 배신자의 배신을 응징한다 + 배신자가 협력하면 용서한다가 합쳐진 것이 팃포탯입니다.

어차피 상대가 계속 배신해 올 동안 틱택이 역시 계속 배신으로 응답했으므로 점수차는 최초 배신당했을 때의 110점 차이일 뿐입니다. 그마저도 상대가 이번에 협력했을때 내가 배신으로 응징에 성공했으므로 점수차는 다시 0이 되었습니다.
상대가 다시 배신해봐야 점수차는 110점으로 되돌아갈 뿐이니 상대가 더 이득을 얻는 것도 아니죠. 그러니 배신자가 모처럼 협력을 한 이번 기회에 상호협력해서 점수를 얻을 길을 찾는 것이 팃포탯 전략입니다.

그런데 팃포탯 전략에 의해 응징을 해야 한다는 말은 많이들 합니다만 팃포탯 전략에 의해 용서를 해야 한다는 말을 들어본 기억은 별로 없습니다.

[날 배신한 놈은 절대 용서 못해] 역시 팃포탯 전략이 어울리지 않습니다.#


이 일을 해결하기 위해서는 팃포탯 전략을 사용해야 한다? 글쎄요....

이 항목은 해석에 따라 옳은 말일 수도 있지만 그른 말일 수도 있습니다.
어떤 일을 해결하기 위해서 팃포탯 전략을 사용할 수 있습니다. 하지만 이 일만을 해결하기 위해 팃포탯 전략을 사용해야 하며, 이 일이 해결되면 팃포탯 전략은 끝난다는 것은 잘못입니다.

어느 회사에서 직원 연수 중에 강사를 초빙해서 강의를 했습니다. 그 강사는 이 팃포탯 전략에 대해 강의를 했습니다. 직원들간에 두 팀으로 나뉘어 서로 협력과 배신을 해 가며 게임을 했습니다.
이렇게 끝났으면 좋았을 것을, 강사는 다음과 같은 말을 덧붙입니다.
"자, 여러분, 팃포탯 전략에 대해 잘 아셨습니까? 그럼 마지막으로 게임 한번만 더 하고 강의를 마치겠습니다."

팃포탯 전략이 상대의 협력을 이끌어낼 수 있는 원동력은 이번에 내가 배신하면 [다음번]에는 상대가 배신할 것이다라는 확신입니다. 그런데 그 [다음번]이 없는 마지막 게임이라면 어떻게 될까요?
위의 회사 강의에서도 [다음번]이 없다는 것을 알아챈 한편이 배신해서 대량의 점수를 가져갔으며, 응징할 기회가 없는 다른편은 배신감에 몸서리쳤습니다.@

그러므로 팃포탯은 끝나지 않는 경기, 최소한 언제 끝날지 알 수 없는 경기에서만 유효합니다. 끝이 보이기 시작하면 그때부터 팃포탯은 힘을 잃게 됩니다.
어떤 일을 해결하기 위해 팃포탯을 사용하는 것은 좋지만, 그 일만을 해결하기 위해 팃포탯을 사용할 수는 없습니다. 여러개의 안건을 모아 엮어서 팃포탯 전략을 설계해야 하며, 팃포탯으로 해결되는 안건만큼 새로운 안건을 추가시켜 팃포탯 전략이 계속되도록 하지 않으면 팃포탯 전략을 효율적으로 사용할 수가 없습니다.
즉, [이 일을 해결하기 위해 팃포탯 전략을 사용한다]가 아니라 [팃포탯 전략에 이 일도 끼워넣는다]가 좀더 정확한 말이죠.


# 이런 식으로 작동하는 전략은 Tit fot Tat이 아니라 Spite입니다. 이 전략 역시 엑셀로드의 실험에 참가했습니다. 결과는 팃포탯보다 훨씬 뒤떨어지는 성과를 보였죠.


@ 응징할 방법이 없어 배신감에 몸서리친 다른편은 어떻게 했을까요? 그들은 결국 상대를 응징할 방법을 찾았습니다. 회사로 돌아간 후 상대방에 대한 업무협조거부로 말입니다.
결국 그 회사 분위기는 엉망이 되었다고 하더군요.
마치 껄끄러운 교사를 해직시켰더니 교육위원으로 돌아온 것처럼 팃포탯이 끝난 것처럼 보여도 언제든지 다시 시작될 수 있습니다.

댓글 2개:

  1. 시뮬레이션을 돌려봤을 때 가장 큰 득점을 얻은 전략은 팃포탯이 아니라 팃팃팃포탯이었다고 하더라고요. 배신을 당하더라도 세 번까지는 봐주는 전략이 통념과는 다르게 가장 좋은 전략이었다고 합니다.

    답글삭제
    답글
    1. 그런 글을 본 적이 있긴 합니다만. 그것은 상대가 [실수로] 배신을 했을 가능성을 보고, 그때도 협력을 이어나갈 수 있는 전략이라서 팃포탯보다 우수할 수는 있습니다.

      하지만 실제로 유전자알고리즘을 적용시켜본 결과는 봐주는 한계까지 배신을 때리는 녀석이 생겨나는 경우가 있다고 합니다. 즉 세번까지는 실수라고 봐주고 네번째 보복을 한다면 세번 실수(배신)하고 그다음부터 협력하는 녀석이 나타난다는 것이죠.
      그런 이유로 팃팃포탯이나 팃팃팃포탯을 실험해 봤지만 결국 팃포탯이 가장 낫다는 결과가 나왔다고 하더군요.

      삭제