확률의 역설

인간의 두뇌는 확률을 계산하는 것에는 부적합하다

어느 수학책에서 본 글입니다. 확률을 계산하다 보면 흔히 직관에 반하는 결과가 나오곤 하기 때문이죠.
동전던지기
이를테면 동전을 10번 던져 10번 모두 앞면이 나왔습니다. 이 동전을 다시한번 던질때 앞면이 나올 확률은 얼마일까요? 많은 사람들은 '확률은 0.5이므로' 뒷면이 나올 확률이 높아진다고 생각하곤 합니다.
그러나 동전이 '지금까지 앞면만 나왔으니 이제는 뒷면이 나와야겠구나'라고 생각할까요, 아니면 동전의 신이 있어 '이 동전은 이제 뒷면이 나와야 확률이 맞겠군'이라 생각할까요? 동전에게 기억력이 없는 한, 과거에 어떤 면이 나왔든지간에 동전에게 있어서는 지금이 항상 '최초의 한번'입니다. 그 때문에 11번째 던졌을 때도 뒷면이 나올 확률은 0.5입니다.

어떤 사람은 확률과 직관이 어긋나는 이유를 '인간이 도박장에서 진화하지 않았기 때문'이라 풀이하더군요. 만약 지구 전체가 도박장이고, 인간들이 돈 대신 '생식 기회(?)'를 걸고 도박을 해서 진화했다면 인간의 두뇌는 확률을 계산하는데 적합하게 진화했으리라는 것입니다.

다행인지 불행인지 인간이 진화한 자연은 무질서 속에서 규칙을 찾을 수 있는 '카오스 시스템'이었습니다. 내일 비가 올지 안올지 확률을 계산하기보다는 제비가 낮게 날고 있으니 내일은 비가 오겠다는 규칙을 발견하는 쪽이, 오늘 달이 뜰 확률을 계산하기보다는 달이 안뜬지 20일정도 지났으니 오늘은 달이 뜨겠다는 규칙을 발견하는 쪽이 생존에 더 도움이 되었습니다. 그 때문에 인간들은 확률을 계산하는 두뇌보다  규칙을 찾는 두뇌가 생존에 더욱 도움이 되었고, 결국에는 규칙이 전혀 없는 동전던지기에서조차 규칙을 찾기 위해 노력하고 위와 같은 오류를 범하기 쉬워진 것이죠(사실 위에서 규칙을 발견하자면 저 동전이 잘못 만들어졌고, 그에따라 앞면이 나올 가능성이 높다는 규칙이 더 바람직합니다).

어쨋든 인간의 두뇌는 확률을 계산하기에 부적합하기 때문에, 실제 확률을 계산해보면 직관과 맞지 않는 상황이 많습니다.

-----

철수와 영희가 이야기를 합니다.
영희 : 난 동생이 둘이야, 여동생도 있어.
철수 : 나도 동생이 둘이야, (옆의 여자아이를 보며)얘가 내 여동생이야.
이때 영희의 동생이 둘 다 여자일 확률은 얼마일까요, 그리고 철수의 동생이 둘 다 여자일 확률은 얼마일까요?
①의 확률이나 ②의 확률이나 똑같을 것이라구요? 잘 생각해 봅시다.

영희의 동생들은 (첫째/둘째)가 다음과 같은 경우가 가능합니다.

(남자/남자), (남자/여자), (여자/남자), (여자/여자)

그런데 '여동생도 있어'라고 했으니 (남자/남자)인 경우는 제외해야 합니다. 남은 3가지 경우 중 (여자/여자)인 경우는 하나입니다. 그러므로 의 확률은 1/3입니다.

철수의 경우는 여동생 하나가 눈앞에 있습니다. 그러므로 ②의 확률은 '다른 동생 하나가 남자냐 여자냐'와 같은 문제가 됩니다. 그러므로 ②의 확률은 1/2가 됩니다.
좀 더 자세히 계산하자면
① 눈앞에 있는 여동생이 첫째동생일 경우(확률 1/2) 막내동생이 여자일 확률도 1/2이므로 둘 다 여자일 확률은 1/2*1/2=1/4
② 눈앞에 있는 여동생이 막내동생일 경우(확률 1/2) 첫째동생이 여자일 확률도 1/2이므로 둘 다 여자일 확률은 이 경우에도 1/2*1/2=1/4
①과 ②는 독립확률이므로 둘 다 여자일 확률 1/4 + 1/4 = 1/2


-----

어느 방에 10명의 사람이 모여 있습니다. 이들 중에 생일이 같은 두 사람이 있을 확률은 얼마나 될까요? 그리고 이 확률이 50%를 넘으려면 이 방에 몇명의 사람들이 모여있어야 할까요? 이 문제를 아시는 분도 있겠지만, 이 문제를 처음 보는 사람들은 대개 확률이 상당히 작다고 생각합니다. 그리고 최소한 365/2=183명은 모여야 확률이 50%가 되리라 생각하곤 하죠.
정확한 계산은 여기(생일이 같을 확률)를 참조하시고, 10명이 모여 있을 때 생일이 같은 사람이 있을 확률은 약 11.7%, 23명일 때 50.7%로서 과반을 넘습니다.


이번에는 이 문제를 살짝만 바꿔 봅시다.

어느 방에 10명의 사람이 모여 있습니다. 이들 중에 나와 생일이 같은 사람이 있을 확률은 얼마나 될까요? 그리고 이 확률이 50%를 넘으려면 이 방에 몇명의 사람들이 모여있어야 할까요?
첫번째 문제와 비슷해 보이십니까? 하지만 답은 전혀 다릅니다. n명이 모여 있다면 확률은

1 - (364/365)n

로서 10명이 모여 있을 때(n=10)는 2.7%에 불과합니다. 그리고 253명이 모여야 이 확률이 50.0477%가 됩니다.

-----

겉으로 보기에는 똑같은 확률이 실제로 계산해 보면 전혀 다른 결과를 보이는 것을 '확률의 역설'이라고 합니다. 사실은 역설이 아니라 사람들이 확률을 제대로 이해 못하기 때문입니다.
다음 문제는 역설이 아니라 직관적으로 쉽게 알 수 있는 문제들입니다.

㉠ 서울 여의도 광장 한복판에 메뚜기 한마리가 있습니다. 이 메뚜기는 1초에 한번씩 임의의 방향으로 1m 뜁니다. 이 메뚜기가 서울을 벗어날 확률은 얼마일까요? 그리고 서울을 벗어난다면 그 시간은 얼마나 걸릴까요?
이것은 뭐 계산이고 직관이고 필요 없습니다. 확률은 0, 시간은 ∞라고 봐도 상관 없습니다. 아마 여의도광장을 벗어날 확률도 0에 가까울걸요.

그렇다면 다음 문제,

㉡ 서울 여의도 광장 한복판에 메뚜기 한마리가 있습니다. 이 메뚜기는 임의의 방향으로 1m 뛴 후 100개의 알을 낳습니다. 다음해 깨어난 100마리의 메뚜기들은 저마다 각자의 방향으로 1m씩 뜁니다. 이 100마리의 메뚜기들 중 서울 중심부에서 가장 먼 메뚜기 10마리가 알을 100개씩 낳습니다. 다음해 이 알에서 깨어난 메뚜기 1000마리가 각자의 방향으로 1m씩 뜁니다. 그리고 또 이들 중 서울 중심부에서 가장 먼 메뚜기 100마리가 알을 100개씩 낳습니다. 이런 일을 반복하면 서울을 벗어난 메뚜기가 나올 확률은 얼마일까요? 그리고 그 시간은 얼마나 걸릴까요?
이것 역시 직관적으로도 확률이 1임을(반드시 서울을 벗어나리란 것을), 그리고 서울의 반지름을 약 14km(14000m)라 본다면(정확한 값은 아닙니다) 약 1만 4천년이 걸리겠다는 것을 알 수 있습니다. 그뿐 아니라 신의주까지의 거리가 약 450km이므로 약 45만년이 흐른다면 한반도를 벗어날 수 있다는 것도 알 수 있습니다.

-----

그런데 이와 같이 쉬운 문제들도 자신의 신앙이 걸리게 되면 이해 못하는(이해 안하는) 경우가 많습니다. 인간의 DNA가 우연히 만들어질 확률, 가장 간단한 단세포생물이 우연히 만들어질 확률을 계산해 놓고는 '이렇게 작은 확률이니 불가능하다'라 결론지어 버리는 사람들이 많죠.


이것은 메뚜기 문제에서 ㉠의 확률을 계산해 놓고는 '메뚜기가 서울을 벗어날 확률은 0이다'라 주장하는 것입니다. 생물의 DNA가 한순간에 합성될 확률, 단세포생물이 한순간에 합성될 확률을 구해 놓고는 불가능한 일이란 결론을 내려버리는 것이죠.

하지만 실제로 진화(화학진화)는 단일개체(단일분자)에서 일어나는 현상이 아니라 개체군(유기용액)에서 일어나는 현상, 즉 수없이 많은 개체(수없이 많은 분자), 게다가 스스로를 증식할 수 있는 생명체(자기복제분자)에서 일어나는 현상입니다. 게다가 좀더 효율적으로 번식하는 개체(좀 더 효율적으로 복제하는 분자)들의 자연선택이 일어나는 과정이죠.

그러므로 그들이 실제로 구해야 할 확률은 메뚜기가 한번 움직이고 그자리에서 번식한 후 다음세대가 움직이는 ㉡의 확률에 더 가깝습니다. 즉 자기복제분자가 스스로를 복제하고, 그들 사이에서 자연선택이 진행되는 것이죠. 이것만으로도 확률은 0에서 1 가까이 뛰어오르게 됩니다.

댓글 6개:

  1. 매월 반드시 하나이상의 포스트를 올려야한다는 강박관념에 시달리시는 참솔님을 위해 심심한 위로의 말씀(?)을 드립니다ㅎㅎ

    답글삭제
    답글
    1. 허걱.. 들켰군요...ㅜㅜ
      제가 스스로 정한 규칙에 얽매이다 보니 이런 함량 미달의 글도 올리게 되는군요...
      다만 저런 규칙도 없으면 저도 글 올리는 것을 잊어버리고 블로그가 죽어버릴 것 같아서 말입니다.

      삭제
  2. GA에 많은 관심이 있어 틈틈히 블로그 챙겨보고 있습니다~
    좋은 글 늘 감사합니다!

    질문이 있어 댓글을 답니다.
    철수와 영희의 동생 문제에서..
    영희의 동생은 순서를 따져서 남자/여자, 여자/남자의 경우를 구분하고있습니다.
    근데 철수의 옆에있는 여동생 역시 동생들 중 큰아이인지 작은아이인지 알수가 없는 상황인데, 왜 큰아이 작은 아이를 구분하지 않고 다른 아이의 성별 확률로 판단하는지 이해가 잘되지 않네요..
    사실 저는 둘다 50%라고 생각을 했거든요, 혹은 둘다 1/3이거나..

    답글삭제
    답글
    1. 먼저 이렇게 들러주셔서 감사합니다.

      철수의 동생들의 경우 계산식 본문에 추가했습니다. 참고하시구요.
      저역시 '도박장에서 진화하지 않은' 사람이기에(^^;) 계산식을 머리로는 이해해도 직관적으로 이해하기는 쉽지 않군요. 다만 이 문제에서 철수와 영희의 문제는 겉모습은 비슷해도 실은 전혀 다른 문제입니다. 철수의 경우는 동생 하나의 확률을, 영희의 경우는 동생 둘의 확률을 계산하는 것이니까요.

      이런 식으로 한번 생각해 보시죠.
      수십개의 봉투가 있습니다. 그리고 수십개의 카드가 있습니다. 각 카드에는 남자 또는 여자라 적혀 있습니다. 그리고 봉투 하나에 아무거나 카드 두개씩을 집어 넣습니다.

      영희의 경우는 봉투 하나씩 꺼내보고 (여동생도 있으므로) 남자만 둘이 들어있는 봉투를 제거합니다. 나머자 봉투들 중에서 여자만 둘 들어있는 봉투는 1/3이겠죠. 그러므로 1/3이 나옵니다.
      철수의 경우는 봉투 하나를 집어 (눈앞에 동생이 있으므로) 아무거나 카드 하나를 꺼내 봅니다. 꺼낸 카드가 남자면 제거하고 여자면 다시 봉투에 넣어 모아둡니다. 이렇게 모인 봉투를 보면 (남자/남자)는 0, (남자/여자)는 절반이 제거되어 1/2, (여자/남자)도 1/2, (여자/여자)는 제가되지 않고 1이 남으므로 (여자/여자)는 1/2가 됩니다.

      이때 주의할 것은 '여동생을 찾아서 내세운다면' 이 확률이 달라진다는 것입니다. 즉 카드 하나를 뽑아보고 남자일 경우 다른 카드도 뽑아본다면 (여자/여자)일 확률은 1/3이 되죠.

      생각나는 대로 썼더니 좀 중언부언 이해하기 어려우실 수도 있겠네요. 죄송합니다.

      삭제
    2. 혹시 영희의 경우도 확률을 계산해보면 첫째둘째를 생각해서
      남자/남자 남자/남자 남자/여자 여자/남자 여자/여자 여자/여자
      총 6가지 경우중에
      남자/남자를 빼면
      4가지 경우중 여자/여자 가 두가지 경우니까 1/2가 아닌가요?

      삭제
    3. 만약 그렇다고 한다면

      첫째를 중심으로 생각할 경우
      .... 첫째가 남자라면 (남 남) (남 여)
      .... 첫째가 여자라면 (여 남) (여 여)
      둘째를 중심으로 생각할 경우
      .... 둘째가 남자라면 (남 남) (여 남)
      .... 둘째가 여자라면 (남 여) (여 여)

      여기서 (남 남)을 빼면 여섯가지죠. 그리고 (여 여)는 두가지므로 1/3입니다.

      삭제