생각하기/생각을 주는 말과 글

통계는 판단을 대신할 수 없다

김성열 2014. 5. 22. 23:03
728x90


Statistics are no substitute for judgment.

Henry Clay


통계는 판단을 대신할 수 없다.

헨리 클레이 (미국의 정치가, 1777~1852)


뉴스를 검색하다보니 '박근혜 지지율'이라는 검색어가 상위에 링크되어 있었다. 링크를 따라가보니 "박 대통령 사과 진정성 통했나? 지지율 60%대로 상승"이라는 기사가 가장 먼저 나왔다. 현 대통령을 지지하지 않는 개인 입장에서의 반감과 더불어 의아함이 솟구쳤다. 거대한 재난을 앞에 두고 무능력과 부패가 서로 경쟁하듯 까발려진 상황에서 (아주 때늦은) 눈물 한 방울로 5% 이상 지지율이 오른다는 것을 어떻게 받아들어야 할까? 더구나 재난은 아직도 진행중인데 대통령의 눈물이 재난을 해결하는 전가의 보도가 된다고 생각해야 하는 것일까? 이런 통계는 어디까지 믿을 수 있는 것일까?


기사를 읽다보니 나름대로 실마리를 잡을 수 있었다. 지지율 조사의 대상자는 1044명, 조사 방법은 집 전화와 휴대전화를 병행한 RDD 방식, 표본 오차는 95% 신뢰 수준에서 3.1% 왔다 갔다, 그리고 응답률은 14.1%. 눈길이 응답률로 자꾸 간다. 1000명 넘게 전화를 걸었는데 응답한 사람은 150명이 채 안된다. 그나마 이정도 응답률은 나은 것이었다. 다른 지지율 관련 기사 중에서는 응답률이 4%인 조사결과도 있었다. 


대통령 지지율 조사가 필요하다는 것은 부정하지 않는다. 하지만 이런 수준의 결과(지지율이 아닌 응답자의 비율)가 나와서야 의미 있는 정보라고 하기 어렵다. 1000명 중에서 고작 200명도 대답하지 않는 설문조사에서 글자 그대로 '통계학적인' 의미 말고 무엇을 더 찾을 수 있을까. 정보로서는 가치가 떨어지니 판단의 근거로 삼는 것에 대해서도 무척 조심스러워야 하겠지만 직접적인 연관이 있는 사람들에게는 또 다른 얘기다.



이런 가치가 거의 없는 정보를 두고도 정치계에서는 일희일비 한다. 응답하지 않은 900명에 대해 신경을 쓰는 것이 더 의미 있어 보이고 필요해 보임에도 불구하고 지지율이 올랐다고 좋아하고 떨어졌다고 낙담한다. 가치가 불충분한 정보를 두고 열심히 스토리를 만들어가는 모습을 보자니 정치가 뭐길래, 권력이 뭐길래 저럴까 라는 생각이 절로 든다. 그나마 통계를 진실 그 자체로 받아들이지 않는 것이 대견할 따름이다.


세상에는 사람들이 불분명하고 무가치한 정보를 무작정 믿고 판단 하길 바라는 집단이 있다. 의미 없는 정보를 바탕으로 스토리를 만들어내고 뭇 사람들이 그 스토리에 함몰되길 바라는 사람들이 분명히 있다. 오히려 그들은 의미 있고 가치 있는 정보에 사람들이 노출되는 것을 싫어할 것이다. 정보의 가치가 높을수록, 의미가 깊을수록 진실에 더 가까이 갈 수 있다는 것을 생각하면 그들은 진실을 두려워하는 사람들임에 틀림 없다.


사람은 진실해야 한다고 생각한다면, 세상은 진실해야 한다고 여긴다면 눈에 보이고 귀에 들리는 것에 촉각을 곤두세워야 한다. 민감하게 굴지 않으면 진실을 두려워하는 집단의 일회용 방패막이로 전락하고 말 것이다. 누군가에게 이용당한다는 것, 그것이 내가 섬세하지 않고 민감하지 않아서라면 기분 나쁜 일이다. 특히 통계를 무작정 신뢰하여 판단의 근거로 삼는 일은 피해야 한다. 비록 통계의 유효성을 모두 거부할 수 없지만 통계가 우리의 판단을 대신해 주지는 않는 것은 명백하니까 말이다.

300x250