Base rate neglect 기저율 무시 / Base rate fallacy 기저율 오류

Last updated on

로또에 당첨되면 조상님 덕!

우리는 희귀한 사건의 가능성은 과대평가하고 일반적인 사건의 가능성을 과소 평가하는 경향이 있다. 우리의 뇌가 새롭거나 특이한 정보에 집중하고 더 평범한 세부 사항은 무시하도록 짜여져 있어 그렇다.

흡연이 폐암 발병률을 높인다는 통계치를 보면서, 누군가는 ‘우리 할아버지는 줄담배를 태우셨는데 건강하게 90까지 사셨어.’ 라고 말한다. 여기서 흡연자의 폐암 발생 가능성이 기저율 base rate 이다. 판단이나 의사 결정에 필요한 사건의 상대적 빈도가 기저율인데, 이런 기저율을 무시하고 머릿속에 떠오른 특정 사건의 가능성을 더 과대평가하기 때문에 그런 논리를 펼치는 것이다.

조상신이 도와줘야 복권에 당첨된다는 속설이 있다. 복권을 산 수 백만 명의 꿈은 무시되고 조상이 나온 꿈만 부각된다. 조상신이 꿈에 나온 뒤 복권에 당첨된 사람은 그 꿈때문에 당첨되었다 믿는다. 그전에도 꿈에 계속 조상이 나왔지만 복권에 당첨되지 않았던 사건은 무시한다.

1974년 인지심리학자 카네만과 트버스키의 논문에서 ‘스티브’ 라는 사람에 대해 아래와 같은 설명을 주고, 이 사람이 농부, 영업사원, 비행기 조종사, 도서관 사서, 의사 등 중 어떤 직업을 갖고 있을지 물었다.

“스티브는 수줍음을 아주 많이 타고 내성적이다. 남들에게 대체로 협조적이지만, 타인이나 세상, 현실에는 별 관심이 없다. 온순하고 깔끔한 성격의 소유자로, 질서와 구조에 대한 욕구가 있으며, 세세한 것에 신경 쓰는 스타일이다.”

짐작하다시피 대부분의 사람들은 이 사람이 도서관 사서일 것이라고 추측했다. 하지만 이런 추측은 미국의 전반적인 직업 분포를 고려하지 않은 결과다. 당시에는 사서에 비해 농부가 압도적으로 많았다. 스티브는 농부일 가능성이 더 높은데도 이를 무시하고, 인물에 대한 묘사가 어떤 직업의 스테레오타입과 비슷한지에만 주목했던 것이다. ‘기저율’을 무시한 것이다.

좀 더 통계적으로 접근해보자. 1983년 대니얼 카너먼과 아모스 트버스키 교수가 시행한 실험이다.

어떤 도시에 블루와 그린, 두 택시 회사가 영업하고 있다. 택시 비율은 블루가 85%, 그린은 15%이다. 한 택시가 한밤중에 뺑소니 사고를 냈는데, 목격자는 그 택시가 그린이라고 했다. 법원에서는 이 사람이 한밤중에 블루와 그린을 얼마나 잘 구별해 낼 수 있는지 검사했는데, 약 80%는 맞았고 20%는 다른 색깔과 혼동했다. 그렇다면 뺑소니 사고를 낸 차가 그린일 가능성은 얼마나 될까?

대부분의 사람들은 그린일 확률이 80%라고 답했다. 택시 비율이 85:15 라고 알려줬지만 이 기저율은 완전히 무시했다. 이 확률은 베이즈의 정리 Bayer’s theorem 을 이용해 구할 수 있는데, 위 확률을 대입해보면 그린일 확률이 대략 40%로 나온다. 사람들이 답한 확률의 절반 밖에 되지 않는다.

어떤 판단을 내리는 데 있어 기저율을 고려하지 않으면 전혀 동떨어진 판단을 할 가능성이 높다. 어떤 조사 결과가 발표 되었을 때 무작정 믿을 것이 아니라 그 배경 이면에 깔린 기저율까지 고려하여 통계적으로 접근할 필요가 있다.

참고 1 2 3