상세 컨텐츠

본문 제목

통계학이 가까이 다가왔다

삶의 지혜를 얻는 책 (영감의 샘)

by 비아토(viator2912) 2022. 3. 7. 00:16

본문

통계학이 가까이 다가왔다. “너 참 아름답다!”

나는 숫자에 약하다. 심지어 숫자만 보면 공황 발작을 일으킬 만큼 숫자가 싫었다. 『벌거벗은 통계학』이 아름답게 다가온 어느 날, 이러한 고정관념과 결별했다.
<벌거벗은 통계학:Naked Statistics>은 쉽고 재미있다. 불필요한 것들은 모두 벗겨내고 기본 개념을 설득력 있는 사례를 들어 쉽게 설명했다. 상관관계, 정규분포, 중심 극한 정리, 유의성, 표준오차, 다중회귀 등 수학 혐오자들이 들으면 귀를 막을듯한 개념을 저자 특유의 내러티브로 재미있게 그려냈다. 대학원 학업 시작 전에 이 책을 읽었더라면 좋았겠다는 생각이 들만큼 좋은 책이다. 데이터를 꿰뚫어 보는 직관의 힘이 필요하다면, 합리적 의사결정 선택을 돕는 정보를 얻고 싶다면, 엉터리 통계를 찾아내는 방법을 찾고 싶다면, 이 책이 해결책이 될 것이다.
우리는 숫자에 근거하여 증명하는 것을 좋아한다. 또한 숫자라면 무조건 믿는 경향이 있다. 때로는 숫자로 인해 웃기도 하고 울기도 하는데 그 중심에 통계가 있다. 엄밀히 말하면 숫자와 통계는 다르다. 계산된 숫자는 정확하더라도, 이 숫자를 해석하는 통계적 활용은 정확하지 않을 수 있기에 진실이 가려질 수도 있다.

찰스 윌런의 &amp;lt;벌거벗은 통계학&amp;gt;

통계는 사회현상을 설명하고 주장을 뒷받침하기 위한 도구로 사용된다.

통계를 올바로 분석하는 눈이 있다면 그 뒤에 교묘하게 숨겨진 의미 파악이나 데이터를 통해 다른 시야로도 분석할 수 있다.
이 책은 통계를 학문적으로 다루기보다는 실생활과 밀접하게 관련 있는 통계에 흥미를 갖게 하고, 진실에 방해가 되는 요소를 분별할 수 있게 하는 것을 목적으로 쓰였다. 복잡한 수식을 몰라도 통계에 대한 직관력을 키울 수 있도록 다양한 주제에서 사례를 들어 쉽게 풀어준다.
'벌거벗은 경제학'으로 이름을 알린 찰스 윌런, 미국 다트머스 대학의 경제학과 교수가 썼다. 1954년에 출판된 <새빨간 거짓말, 통계>에 대한 존경의 의미로 쓰기 시작했다고 한다. 마크 트웨인도 이 책에서 아이디어를 얻어 "거짓말에는 세 종류가 있다. 거짓말, 새빨간 거짓말, 그리고 통계."라고 언급했다. 통계의 단면을 적나라하게 함축한듯하다.
통계에서 보여주는 데이터가 시사하는 바를 잘 분별할 줄 알아야 하고, 통계적 오류를 발견하고 그릇된 해석을 걸러내기 위해서라도 통계에 대해 아는 힘은 중요하다. 통계학은 세상을 이해하는 강력한 도구임에 분명하다.

우리가 통계학을 배우는 이유는 다음과 같다.

  • 방대한 데이터를 요약하기 위해,
  • 보다 나은 의사 결정을 위해,
  • 사회적 문제에 해답을 찾기 위해,
  • 사기꾼을 잡고 범인을 기소하기 위해,
  • 정책이나 의약품, 의료 처치, 기타 혁신의 효과를 높이기 위해,
  • 통계를 악용하는 악당을 발견하기 위해.

사회에서 빈번히 접하는 통계 사례 중 두 가지, 여론조사와 의약품의 출판 편향에 대해 살펴본다.

여론조사는 제대로만 이루어진다면 매우 정밀한 수단이다. 세계 최대 국제조사기구 갤럽의 편집장에 따르면 천명을 대상으로 여론조사를 할 경우 국민 전체 의견에 대해 정확하고 의미 있는 통찰을 얻을 수 있다고 한다. 하지만 정확하고 의미 있는 결과를 얻으려면 반드시 올바른 방식으로 여론조사를 해야 하고 결과를 정확히 해석해내야 하는데, 이는 말처럼 쉬운 일이 아니다.
잘못된 설문조사 결과는 계산 실수로 생기는 경우는 거의 없고, 대부분 편향된 표본이나 잘못된 질문에서 조사를 망치는 경우이다. 여기서 쓰이는 말이 “Garbage in, Garbage out”이다. 잘못된 표본을 넣으면 잘못된 결과가 나온다는 의미이다. 즉, '뿌린 대로 거둔다'는 뜻이다.
여론조사를 검토할 때 반드시 해야 하는 질문들을 참고해 보자.

  1. 의견을 알아내고 싶은 모집단에 대한 정확한 표본으로 추출하였나?
  2. 관심 주제에 대한 정확한 정보를 이끌어낼 수 있게 질문이 제시되었나?
  3. 응답자가 사실을 말했는가?

즉, 알맞은 표본을 찾아 연락했는지와 정확한 질문과 응답자의 진정성에 따라 여론조사의 성패가 달려있다고 해도 과언이 아닐 것이다.

통계는 올바로 사용되면 유익하지만 잘못 쓰인다면 치명적일 수 있다.

잘못된 분석이나 의도된 근거로 심각한 오류를 범하거나 타인을 속이는데 악용될 여지도 있다. 그러므로 여론조사나 설문조사 결과를 그대로 믿기 전에 제대로 된 표본인지 의심해보아야 할 것이다.
빅데이터 시대임에도 다양한 편향으로 인해 여전히 좋은 데이터는 구하기 어려운 실정이다. 실제로 부정적인 연구결과는 매력적이지 않다는 이유로 노출조차 꺼리게 되는 ‘출판 편향’은 심각하다. 우울증 치료제에 관한 출판 편향에 대해 <뉴욕타임스> 기사를 요약하여 살펴보면 다음과 같다.
항우울제의 약효가 긍정적으로 나온 연구는 94%나 발표된 반면, 긍정적이지 않은 결과를 얻은 연구는 단지 14%만 발표되었을 뿐이다. 항우울제에 대한 모든 연구를 고려했을 때, 항우울제는 위약에 비해 ‘약간의’ 효과만 있었다. 제조사들은 실제 진행한 임상 시험 결과 중 약 3분의 1은 전혀 발표하지 않았는데, 그 결과 약물의 진정한 효과에 대해 의료진과 소비자를 호도하게 된다. 이는 우울증으로 고생하는 환자들에게 중요한 문제가 될 수 있다. 이런 문제를 해결하기 위해 최근 의학저널들은 연구를 시작하는 시점에 미리 해당 내용을 등록하게끔 정해 놓고 있다고 한다.

통계의 함정

통계는 이미 우리 생활과 밀접한 관계를 맺고 있다.

통계는 학교 성적, 회사 인사고과, 여론조사나 세균 검사 등 다양한 분야에서 활용된다. 평균, 중앙값, 표준편차 등, 통계의 기본개념은 이제 성적표만 받아보더라도 알 수 있다. 책에서 중심 극한 정리와 회귀분석에 대해서도 간단하게 설명했다. 제대로 추출된 표본집단의 평균값은 모집단의 평균값과 거의 일치한다는 개념의 중심 극한 정리, 분석대상의 데이터를 교란시키는 변수들을 제외시켜 진짜 원인을 찾아낼 수 있는 회귀분석도 자주 사용되는 통계이다. 이 책을 읽고 혼동했던 몇 가지 통계 개념에 대해 직관적으로 이해하는데 도움을 얻었다.
정확한 통계를 얻으려면 반듯이 제대로 된 데이터를 활용해야겠다. 표본이 좋을 때는 표본 크기가 클수록 오차범위가 줄어 설문조사도 좋아진다. 반면에 표본이 좋지 않을 때에는 표본크기가 클수록 쓰레기 더미만 거대해진다는 것을 명심, 또 명심하자.
데이터가 넘치고 가짜 뉴스 또한 넘치는 시대에 살고 있다. 누군가 사익을 취하기 위한 방법으로 악용된 통계로부터 냉철한 통찰력을 원한다면 이 책을 읽어보라고 권하고 싶다. 또한 경제 흐름과 사회현상을 분석하는 틀을 다지고 싶다면 찰스 윌런의 또 다른 저서 『벌거벗은 경제학』, 『돈의 정석』도 이어서 읽으면 유익할 것 같다.

찰스 윌런의 <벌거벗은 통계학>을 읽고 작성했습니다.


함께 보면 좋은 글

[돈의 심리] 화폐 가치 착각(Money illusion)과 인플레이션 ①
[돈의 심리] 화폐 가치 착각(Money illusion)과 인플레이션 ②

관련글 더보기

댓글 영역