19대 대선 문-홍 K값은 1.6...정규분포

2017년 06월 01일 16시 29분

19대 대선 개표 분류기 미분류율 4.16%...18대 3.6%보다 높아져

지난 5월 9일 실시된 19대 대통령 선거에서 개표 분류기의 미분류율은 4.16%로 나타났다. 또 미분류표에서 홍준표 후보가 득표한 비율은 약 29%로 분류표에서 득표한 비율 약 23%보다 높은 것으로 분석됐다. 반면 문재인 후보의 득표율은 분류표에서 41%였지만 미분류표에서는 이보다 낮은 32% 가량인 것으로 나타났다.

뉴스타파가 중앙선거관리위원회로부터 19대 대통령 선거의 250개 선거구 개표현황 데이터를 입수해 분석한 결과 미분류표로 분류된 투표지는 모두 1,354,723표로 총 투표수 대비 미분류율은 4.16%로 나타났다. 이 가운데 무효표로 최종 확인된 투표지는 130,598표로 전체의 0.4%로 나타났다. 18대 대선에서의 미분류율은 3.58%였으며 무효표의 비율은 전체 투표자 수의 0.41%였다.

1, 2위간 상대적 득표율, 이른바 K값은 1.60...지난 대선 K값 1.5에 비해 약간 커져

또 분류표와 미분류표에서의 문재인 후보와 홍준표 후보의 상대적 득표비율을 계산한 결과 250개 선거구의 평균값(이른바 K값)은 1.60으로 계산됐다. 이 수치는 문재인 후보와 비교했을 경우 홍준표 후보의 미분류표 득표율이 분류표 득표율보다 상대적으로 높았다는 것을 의미한다.

지난 4월 개봉한 영화 <더 플랜>에서 제기한 K값이란 개념은 미분류표에서 두 후보 간의 득표비율을 분류표에서의 득표비율로 나눈 값을 말한다. 투표지는 개표 분류기를 통과하게 되는데 개표 분류기가 일정한 분류 기준에 따라 특정 후보의 득표로 분류해 낸 표가 분류표이고 미분류표는 어느 후보의 득표인지 투표 분류기가 확정하지 못해 개표 심사위원들의 판단을 받도록 보류해 놓은 표다.

▲ K값은 분류표와 미분류표에서의 두 후보 간의 상대적 득표율을 의미하는 것으로 영화 '더 플랜'에서 제기한 개념이다.
▲ K값은 분류표와 미분류표에서의 두 후보 간의 상대적 득표율을 의미하는 것으로 영화 '더 플랜'에서 제기한 개념이다.

<더 플랜> 제작팀은 분류표에서 두 후보 간의 득표 비율이 1:1로 나왔다면 미분류표에서도 1:1이 나와야 한다면서 그럴 경우 K값이 1이 나와야 하고, 이것이 정상인데 18대 대선에서는 K값이 1.5가 나왔다면서 문제를 제기했다. 즉 미분류표에서 박근혜 후보의 득표가 분류표보다 상대적으로 많이 나왔고, 전국적으로 K값이 1.5를 기준으로 정규분포를 그린만큼 개표 분류기를 누군가 인위적으로 조작했을 가능성이 있다는 의혹을 제기한 것이다.

18대 대선 당시 문재인 후보와 박근혜 후보 사이의 K값(당시 251개 선거구 평균값)은 1.49였다.

▲ 영화 '더 플랜' 화면 캡처
▲ 영화 '더 플랜' 화면 캡처

이번 19대 대선에서는 1,2위 후보간의 이른바 K값이 1.6으로 나타났다. <더 플랜>팀이 ‘개표 분류기 조작’ 의혹의 근거로 제기했던 18대 대선의 데이터보다 오히려 더 커진 데이터가 이번에도 나타난 것이다.

▲ '더 플랜' 팀이 18대 대선에 적용했던 것과 같은 방식으로 구한 19대 대선에서 문재인 후보와 홍준표 후보 사이의 K값은 1.60으로 나타났다.
▲ '더 플랜' 팀이 18대 대선에 적용했던 것과 같은 방식으로 구한 19대 대선에서 문재인 후보와 홍준표 후보 사이의 K값은 1.60으로 나타났다.

문재인 후보에 대한 안철수 후보의 K값은 1.24, 유승민 후보의 K값은 0.93으로 나타났다.

이는 안 후보의 경우 문 후보에 대한 상대적 득표율이 분류표보다 미분류표에서 높았음을 의미하고, 유 후보의 경우 미분류표에서의 상대적 득표율이 분류표에서보다 미미하게 낮았음을 의미한다.

문재인 후보 기준홍준표안철수유승민심상정
K값1.601.240.930.71

▲ 문재인 후보 대비 각 후보의 K값 비교. 1보다 큰 값이면 분류표에서보다 미분류표에서의 상대적 득표율이 높았음을 의미하고 1보다 작으면 그 반대를 의미한다.

이는 일각에서 제기된 지적처럼 K값의 의미가 특정 후보에 대한 지지자층의 연령대 비율과 일정한 관계가 성립될 수 있다는 것을 보여주는 수치다.

홍준표 후보에 대한 다른 후보의 K값은 모두 1 이하로 나타났다. 이는 홍 후보의 경우 분류표에서보다 미분류표에서 상대적으로 다른 모든 후보보다 득표율이 높았음을 의미한다.

홍준표 후보 기준문재인안철수유승민심상정
K값0.640.780.580.45

▲ 홍준표 후보 대비 각 후보의 K값 비교. 나머지 후보 4명의 K값이 모두 1 이하다. 이는 홍 후보의 미분류표에서의 상대적 득표율이 타 후보 4명보다 높았다는 것을 의미한다.

19대 대선 선거구별 K값 분포도 정규분포 곡선 이뤄

또 이번 대선에서도 250개 선거구의 K값 분포가 지난 18대 대선과 마찬가지로 거의 정규분포에 가깝게 나타난 것으로 분석됐다. 이는 정규분포 형태의 곡선이 외부의 개입이나 조작 때문이 아니라 표본 수가 많을 때 나타나는 자연스러운 현상임을 보여주는 근거로 해석된다.

▲ 18대 대선에서 251개 선거구의 K값 분포는 1.5를 중심으로 밀집돼 있다. 가로축은 K값, 세로축은 K값이 나타난 빈도 숫자이다.(왜도는 0.42로 정규성에 문제가 없었다. 왜도가 ±2 이상일 경우, 정규분포가 아닌 것으로 본다.)
▲ 18대 대선에서 251개 선거구의 K값 분포는 1.5를 중심으로 밀집돼 있다. 가로축은 K값, 세로축은 K값이 나타난 빈도 숫자이다.(왜도는 0.42로 정규성에 문제가 없었다. 왜도가 ±2 이상일 경우, 정규분포가 아닌 것으로 본다.)
▲ 19대 대선에서 문재인-홍준표 후보 간의 K값 분포는 1.6을 중심으로 밀집돼 있다. 왜도는 -0.275로 나타나 정규분포를 보였다.
▲ 19대 대선에서 문재인-홍준표 후보 간의 K값 분포는 1.6을 중심으로 밀집돼 있다. 왜도는 -0.275로 나타나 정규분포를 보였다.
▲ 문재인-안철수 후보 사이의 K값 분포는 1.24에 밀집돼 있다. 왜도는 -0.1로 정규성에 문제가 없었다.
▲ 문재인-안철수 후보 사이의 K값 분포는 1.24에 밀집돼 있다. 왜도는 -0.1로 정규성에 문제가 없었다.

김재광 아이오와 주립대 교수, “18대, 19대 K값 비슷하면 <더 플랜> 주장 틀린 것”

이에 대해 <더 플랜> 영화에 출연하기도 했던 김재광 아이오와 주립대 통계학과 교수는 뉴스타파 취재진과의 통화에서 “이번 대선의 경우 표 차이가 많이 났기 때문에 대선 조작은 없었을 것으로 보인다”면서 “이번 대선에서 지난 대선과 마찬가지로 K값이 1.5 이런 식으로 나온다면 <더 플랜>의 주장은 틀린 것”이라고 말했다.

뉴스타파는 다각적인 취재와 분석을 바탕으로 지난 18대 대선 결과를 둘러싸고 빚어졌던 개표 부정 의혹의 진실을 규명하는 프로그램을 제작해 조만간 방송할 예정이다.


취재:최기훈, 김강민

관련뉴스