통계의 함정
거짓뉴스의 시대를 사는 우리가 반드시 유념해야 할 질문
“통계를 만드는 사람들은 누구이며, 그 목적은 무엇인가”
세계적인 심리학자, 통계학자, 경제학자가 경고하는 통계의 함정과 오류
독일 《슈피겔》, 아마존 베스트셀러 1위
현대 사회는 숫자와 확률로 규정되고 전달되지만 우리가 일상으로 접하는 통계에는 수많은 허위정보가 담겨 있다. 인터넷 시대는 엄청난 속도로 광대한 정보에 접근하게 해주었음에도, 정작 정보의 리스크와 불확실성을 간파하지 못하면 그 의미를 이해할 수 없다. 이러한 무지는 갖가지 부작용을 낳을 뿐만 아니라 생명을 위협하는 위험까지 초래하곤 한다.
이런 정보화 시대의 심각한 부작용을 우려한 심리학자 게르트 기게렌처와 통계학자 발터 크래머, 경제학자 토마스 바우어는 정기적으로 ‘이달의 불량통계’를 선정하여 발표하는 프로젝트(www.unstatistik.de)를 진행하는 데 의기투합하고, 그렇게 현장의 불량통계를 접한 경험을 집약해 《통계의 함정》을 발표했다. 이미 오래전부터 잘못 전파된 통계를 주제로 계몽활동을 해온 저자들의 ‘수학에 대한 무지를 치료할 처방전’ 격인 이 책은 출간 이후 지금까지 베스트셀러로서 독자들의 호평을 받고 있다.
■ 통계는 죄가 없다
단, 어떤 통계도 믿지 말 것
경제, 건강, 사회정책 등에서 따라 나오는 온갖 수치들에 현혹된 사람들은 데이터를 조작하는 이들에게 돈을 투척하고 엉뚱한 대상을 금과옥조로 떠받든다. 도달할 수 없는 목표를 향해 안간힘을 쓰는가 하면, 잘못된 증거를 근거로 죄 없는 사람을 감옥에 보내고, 하찮은 내용이 부풀려진 것도 모른 채 아까운 자원을 낭비한다. 일상에서 일어날 확률이 거의 없는 사소한 위험에 괴로워하면서도 정작 신체와 생명에 실질적인 위협이 되는 것은 기꺼이 끌어들인다. 이 모든 것은 수치를 올바로 이해하는 법을 배우지 않았거나 배우려 들지 않아서다.
저자들은 우선 그 지점을 지적한다. 저자들이 제시하는, 통계왕국에서 쏟아져 나오는 실수와 오류, 조작의 사례들을 살피다 보면 우리가 얼마나 허위정보에 압도돼 살고 있었는지, 확률과 통계에 얼마나 무심했는지를 깨닫게 된다. 왜 지금 읽기와 쓰기만큼이나 통계학에 관한 기초훈련이 절대적으로 필요한지 수긍할 수 있다. 이러한 자각이 시작되는 순간, 숫자 뒤의 속임수를 꿰뚫어보고 ‘팩트’의 가치를 판단할 수 있으며, 그리하여 진실된 정보와 허위정보를 구별해내는 법을 훈련하는 것이 가능해진다. 비로소 현실의 실상을 보고 싶은 대로가 아닌 있는 그대로 보게 되는 것이다.
우리 저자 일동은 여러 가지 예를 통해 이런저런 베일을 들쳐보거나 완전히 걷어내어 사실을 ‘밝히는 데’ 기여하고 싶다. 동시에 우리는 이런 형태로 퍼져 있는 이른바 수학에 대한 무지를 치료할 처방전을 쓰려고 한다. (중략) 무엇보다 바라는 것은, 이런 불량통계가 시간이 지날수록 힘을 잃어 더 이상 추종하는 사람이 생기지 않는 것이다.
―‘책머리에’ 중에서
■ ‘위험하다’는 말을 어디까지 믿을 것인가
통계가 애용하는 속임수들
언론은 과장을 좋아한다. 그리고 이 점에 있어서는 화젯거리를 좋아하는 언론 소비자 또한 책임이 크다. 어떻게 해서 별것 아닌 일이 크게 부풀려지고 위협적인 사안이 되는 것일까?
이치는 간단하다. 리스크의 절대치가 아닌 상대치를 이용하는 것. ‘2010년에 비해 상어 공격이 2배 증가’했다는 뉴스는 전 세계에서 상어의 공격으로 사망한 건수가 2010년 6건에서 2011년 12건으로 늘어난 사례를 수치화해 보도한 것이다. 그런가 하면 ‘직장암의 위험을 50% 줄여주는 신비의 약’이라는 헤드라인은 직장암의 발생률은 100명당 2명에서 1명으로 낮췄으나 유방암은 1명에서 2명으로 높이는 부작용이 관찰된 신약이 대상이다. 이 경우 높은 효능 대비 ‘유방암 발생률은 1%p 증가’라는 부가설명이 붙는 것으로 끝이다. 효능은 상대적 수치로, 부작용은 절대적 수치로 기술하는 이중 잣대의 적용은 특히 의학전문 기사에서 빈번하게 찾아볼 수 있다.
그런가 하면 퍼센트를 내세움으로써 판단을 흐리게 하는 방법도 있다. 퍼센트는 복잡한 상황을 단순화하고, 크기의 비율을 실감나게 만들어 비교가능하게 해주며, 객관성과 확실성, 신뢰와 권위를 전달하는 수단으로 애용되지만, 정작 사람들은 이를 얼마나 잘 이해하고 있을까. 백분율은 다른 뭔가에 대한 비율을 숫자로 나타낸 것이므로 이른바 기준이 되는, 이 ‘다른 뭔가’의 크기가 아주 중요하다. 기준 없이 ‘40%’라고만 하면 아무 의미가 없는데도, 현실에서는 안타깝지만 이 기준이 모호할 때가 많다. ‘젖소 한 마리당 우유 생산량이 20% 늘어나면 젖소가 20% 줄어도 총생산량은 똑같다’는 생각은 맞을까?
수치 이면에 가려진 실체적 진실에 근접하기 위해서는 상대적 수치, 절대적 수치, 퍼센트, 퍼센트포인트 등 통계에서 왜곡되는 개념들을 주의해서 살피는 자세가 필요하다.
유방암 검사를 받은 50세 이상의 여성 1,000명 중 10년이 지나 유방암으로 사망한 숫자는 4명 정도 된다. 검사를 받지 않은 여성 중에는 5명이 사망했다. 바꿔 말하면 1,000명의 여성이 유방암 사망자 수를 1명 줄이기 위해 10년 동안 검사를 받았다는 얘기가 된다. 여성들에게 이 결과를 보?㈐?때는 대부분 ‘20퍼센트 감소’(5명에서 4명으로)라고 말한다. 여기서는 상대적 리스크 감소(20퍼센트)가 절대적 리스크 감소(0.1퍼센트포인트)보다 당연히 더 깊은 인상을 준다. 또 여성들이 대개 이 차이를 깨닫지 못한다는 것도 염두에 둔다. 하지만 1,000명에서 1명 감소하는 것을 놓고 검진으로 목숨을 구할 수 있다고 말하면 안 될 일이다. ―본문 42∼43쪽
이밖에 통계상의 오류나 함정을 설명하기 위한 다양한 용어도 빼놓을 수 없다. 결과를 알고 난 뒤의 가설 세우기라고 할 ‘명사수 효과’, 상관관계와 인과관계를 혼동한 데서 오는 해석의 오류, 작은 리스크를 피하려다 큰 위험을 자초하는 ‘제로 리스크 환상’, 원하는 결과를 찾아내기 위해 끝없이 데이터를 찾아 헤매는 ‘데이터 마이닝’, ‘영가설’과 ‘대립가설’을 둘러싸고 빚어지는 ‘제1종 오류’ 등 각각에 해당하는 흥미로운 일화와 상세한 설명을 통해 저자들은 일상의 통계학을 수월하게 이해하도록 안내한다.
■ 통계만 있으면 무엇이든, 심지어 진리까지도 입증할 수 있다
교묘한 표본을 사용하면 거의 모든 결과를 끌어낼 수 있다. ‘오랫동안 데이터를 잡고 씨름하다 보?? 그 데이터는 원하는 결과를 털어놓을 것이다’라는 믿음은 주변에 넘쳐나는 불량통계의 주범이기도 하다. 이러한 신념이 특정 목적을 주입하기 위해 활용된다면 그 피해는 고스란히 일반 대중이 떠안을 수밖에 없다.
어떤 신약이 사실상 효과 면에서 플라시보보다 나을 것이 없다고 쳐보자. 일단 당국에서는 판매허가 신청을 받는다.
제약사에서는 여러 방법으로 검정하게 한다. 첫 번째 실험에서는 치료그룹과 비교그룹 사이에 별다른 차이가 발견되지 않는다. 두 번째 실험에서는 치료그룹이 더 나빠지기까지 한다. 반대로 세 번째, 네 번째 경우에는 다소 효과가 나타난다. 이런 식으로 계속 실험하다 보면 어느 시점에는 우연히 변칙현상이 나타나기 마련이고 관점에 따라서는 이것이 중요한 치료 효과로 보일 수도 있다. 바로 이 연구결과를 언론에 발표하는 것이다. 그러면 이 결과는 반론의 여지가 없는 ‘유의미한’ 결과가 된다. ―본문 94쪽
한편, 우리는 거의 매일같이 언론을 통해 건강에 해로운 식품에 관한 정보를 접하지만 그중 상당수가 불량통계를 토대로 한 사실상의 허위정보들이다. 일례로 농약 성분이 검출되었다는 보도는 대개 위험성과는 거리가 먼 것들이다. ‘만물은 독성이 있으며 독성이 없는 물질은 전무하다. 독성이란 오직 그 복용량에 따라 결정된다’는 파라켈수스의 명제는 여전히 유효하기 때문이다. 음식물에 들어 있는 유해물질의 99.99%는 처음부터 자연 상태로 존재하는, 스스로를 보호하기 위해 식물 자체에서 생산되는 화학성분이며 오로지 0.01%만이 생산단계나 포장, 판매 과정에서 추가된다. 사실상 위험성과는 거리가 먼 결과를 언론은 대서특필하고 위험성을 과장하여 대중을 불안에 떨게 만드는 것이다.
이 밖에 흔한 예로 범죄율과 실업률, 빈곤율이나 빈곤선에 관한 불량통계도 있는데, 이 같은 주요 지표는 사실상 어떤 기준을 적용하느냐에 따라 편차가 심해질 수밖에 없다. 그 기준에 따라 각국의 경제지표는 쉽사리 순위가 뒤바뀌기도 한다. 올림픽 경기의 메달 수를 놓고 집계방식에 따라 1등 국가가 달라지는 것도 마찬가지다. 저자들은 또 불평등한 임금이라는 통계에도 문제를 제기한다. 남녀의 임금이 불평등하다는 주장은 흔한 것이지만, 사실 그것은 하는 일이 다른 데서 오는 당연한 결과로써 본질은 불평등한 일이라는 것이다.
여성의 저임금에 대한 보도를 우리가 이달의 불량통계로 선정한 데는 다 이유가 있다. 이런 통계를 보면 마치 사과와 배처럼 비교할 수 없는 것을 비교하고 있다. 장관의 말처럼 ‘같은 일을 하는’ 여성이 남성 소득의 77퍼센트밖에 못 받는다는 것은 사실이 아니다. 물론 여성이 덜 받는 것이 분명하지만, 같은 일을 하는 것은 아니라는 말이다. (중략) 남자와 여자라는 측면에서 평균 총임금이 차이가 난다고 할 때, 대우가 불평등하다고 주장하려면 직업 활동을 하는 남녀를 기준으로 임금책정에 중요한 의미가 있는 실무 경험 같은 자격이 평균적으로 비슷할 때만 그 차이는 유력한 증거가 될 것이다. ―본문 193∼194쪽
저자들이 제시한, 통계를 올바로 이해하는 방법들은 다양하다. 단순 다수결과 질적 다수결의 차이, 여기서 한 단계 진화된 콩도르세 규칙은 통일 독일의 수도를 베를린으로 정할 때 적용한 방법으로 유명하다. 단순 비교의 함정도 흔히 놓치기 쉬운 오류이며, 암과 기대수명의 관계도 우리가 잘못 해석하기 쉬운 통계에 속한다. 암 발병률은 기대수명이 높은 나라일수록 높기 때문인데, 바꿔 말하면 암은 살기 좋은 나라에서 많이 발생한다는 역설이 가능하다는 것이다.
끝으로 저자들은 통계를 대하는 바람직한 태도를 당부한다. 일명 정??왜곡과 조작에 성공적으로 대처할 수 있는 황금률이다. 중요한 몇 가지를 예로 들면 이러하다.
1. 각각의 통계를 만드는 사람이 누구인지, 그가 거기서 노리는 목표가 무엇인지 항상 의문을 품을 것.
2. 상관관계와 인과관계를 절대 혼동하지 말 것.
3. 제로 리스크 환상, 즉 모든 리스크를 완전히 배제하려는 시도를 피할 것.
4. 퍼센트의 바탕에 주목할 것. 무엇에 대한 퍼센트인가?
5. ‘과학적으로’ 또는 ‘유의미한’이라는 형용사의 남용을 조심할 것.
6. 표본조사에서는 표본의 대상이 누구인지, 그리고 누가 대상이 아닌지를 주의할 것.
7. 증가율을 절대 산술적 수치로 생각하지 말 것. 60% 이상과 50% 이하의 평균은 5% 이상이 아니다.
이 책을 통해 숫자나 통계가 포함된 자료를 다시 한 번 눈여겨보는 습관, 사실성을 확인하게 되는 긍정적인 각성 효과가 나타나기를 기대한다.