존재하지 않는 데이터를 있는 것처럼 허위로 꾸미거나 다른 연구자가 수집해 검증한 모집단·표본과 결괏값을 베끼는 방식이었다. 기초적 계산도 맞지 않는 엉터리 통계표도 여럿 나왔다.
먼저 소개하는 학생들의 데이터 위조 논문은 “Study of the Role and Impact of SNS in Protests: The Case of Candlelight Vigil of 2016 in South Korea with Data Visualization Using Python”이다. 14쪽 분량이다. 2016년 한국의 촛불집회 사례를 통해 집회 참여와 SNS 사용의 상관관계를 분석하고 있다. 학생들은 파이썬을 이용했다고 썼다.
이 논문은 학생들이 쓴 25개 논문 중 출판일 기준으로 초기에 만들어졌다. 2021년 2월 발표됐다. 저자는 4명이다. 1저자와 2저자는 한동훈 법무부 장관의 처조카들이다. 처조카 두 명은 미국 유명 사립 대학에 합격했다.
이 논문은 미국 뉴멕시코주립대학 이상원 교수가 2018년 ‘국제커뮤니케이션 저널(International Journal of Communication)’에 발표한 논문을 표절했다. 검색 프로그램(CopyLeaks)으로 두 논문을 대조한 결과, 표절률은 46%였다. 이상원 교수는 표절률이 50% 미만으로 나온 이유를 이렇게 설명했다.
“그대로 베끼지 않고 조금씩 변형시켰다든가, 단락 같은 것을 기존 글의 구조에서 이동했다든가 이런 과정들이 있기 때문에 표절률 자체는 조금 더 낮아지긴 했는데, 본질적으로는 그냥 글 전체를 다 베낀 거라고 할 수 있겠습니다.” -이상원 뉴멕시코주립대학 교수 (논문 표절 피해자)
페이스북·인스타그램 둘 다 연구했다? 페이스북만 연구했다?
원논문의 저자인 이상원 교수는 SNS 중 페이스북을 중심으로 촛불집회 참여를 분석했다. 이 교수가 페이스북을 선택한 이유는 분명했다.
이 교수가 밝힌 대로 “페이스북이 한국에서 압도적으로 많이 쓰이는 사회관계망서비스(SNS)”이었기 때문이다. (In this study, I focus on the role of Facebook because it is overwhelmingly the most popular social media platform in South Korea.) 학생들도 이 문장을 그대로 베꼈다.
학생들은 그러나 논문의 다른 문장에서 페이스북과 인스타그램을 중심으로 분석했다고 써놨다 (Focusing primarily on Facebook and Instagram as Social Networking Sites). 이 교수의 논문에는 전혀 등장하지 않는 ‘인스타그램’ 문구가 학생들의 논문에선 17번 나온다. 그러나 학생들의 논문 어디에도 인스타그램을 분석한 결과는 나오지 않는다. 이 교수가 조사한 페이스북 분석만 베꼈을 뿐이다.
위조 정황① 직접 광화문에서 촛불시민 300명을 조사했다?
표절보다 심각한 건 데이터 위조다. 학생들은 논문을 쓰기 위해 직접 데이터를 모으고 가설을 검증해 결론을 도출했다고 썼다. 그러나 논문을 읽어보면, 학생들의 주장이 거짓이라는 것을 알 수 있다.
학생들은 두 종류의 설문조사를 했다고 썼다. 먼저 2016년 12월 31일 촛불집회가 광화문에서 열렸을 때, 300명을 현장 설문조사(Field Survey) 했다고 밝혔다. 2016년 당시 논문의 1저자와 2저자는 각각 중학교 1학년과 2학년이었다.
▲ 학생들이 쓴 표절 논문의 연구 방법론에 따르면, 학생들은 2016년 12월 31일 촛불집회 당일 광화문광장에 모인 시민 300명을 대상으로 현장 설문조사를 실시했다.
학생들은 2016년 12월 31일 300명을 현장 조사했다고 밝혔으면서도 정작 300명에게 뭘 물었고, 결과는 뭐였는지 단 한 줄도 쓰지 않았다. 이 때문에 학생들이 실제 조사를 했는지 의심이 들지만 확인할 방법은 없다.
위조 정황② 세계인에게 촛불집회에 몇 번 나왔는지 물었다?
이상원 교수는 2016년 12월 19일~23일까지 한국인(South Korean national panel) 성인 932명을 온라인으로 설문 조사했다. 학생들도 온라인 설문조사를 했다고 밝혔다.
학생들의 논문에 따르면, 온라인 설문 조사의 응답 대상자는 한국인이 아닌 “전 세계인(worldly panel)” 100명이다. 100명 중 90명이 설문을 완료했다고 적었다.
조사의 목적이 한국에서 일어난 촛불집회에 관한 것인데, 조사 대상자는 전 세계인이다. 상식에 맞지 않는다. 90명 응답자의 정체와 응답 결과가 위조됐다는 사실이 곧 밝혀진다.
위조 정황③ 미국 흑인, 원주민이 촛불집회 평균 2.5회 참가했다?
학생들의 논문 9페이지. 학생들은 응답자 90명이 어떤 사람들인지 보여주는 통계 그래프를 만들었다. 그런데 황당하게도 90명을 인종·민족(ethnicity) 별로 분류했다.
학생들이 만든 도표에 따르면, 한국 촛불집회 관련 응답자 90명 중 미국 흑인(African American)이 28명으로 가장 많았다. 그다음 미국 원주민(Native American)이 25명으로 많았고 백인(Caucasian)은 15명이었다. 아시아계 사람(Asian)과 중남미계 사람(Hispanic)은 각각 11명, 하와이 원주민(Native Hawaiian/ Pacific Islander)도 10명 포함됐다.
학생들은 미국 흑인(28명)은 물론, 백인(15명), 하와이 원주민(10명), 미국 원주민(25명)에게 대한민국에서 일어난 촛불집회에 몇 번이나 참가했는지 조사했다는 이야기다. 더구나 학생들은 90명을 인구·주택 총조사(census) 방식에 따라 선정했다고 설명했다.
▲ 학생들이 실시한 온라인 설문조사 응답자의 인종(ethnicity) 분석 그래프 (학생이 만든 인종 분석 그래프를 재구성)
학생들의 설명에 따르면, 응답자에게 한국 촛불집회 참가 횟수를 0회~7회(0= 한 번도 참석하지 않았을 경우, 7= 7번 이상 참석했을 경우) 중 선택하도록 했다. 그 결과 90명이 한국 촛불 시위에 참석한 횟수는 평균 2.5회 나왔다.
미국 흑인과 원주민이 전체 표본(90명)의 절반 이상(53명)을 차지하는 설문에서 실제 조사를 했더라도 나올 수 없는 결괏값이다. 설문조사를 하지 않고 한 것처럼 데이터를 위조했다는 명백한 증거다. 논문 원저자인 이상원 교수는 “(학생들이) 연구를 직접 수행하지 않고 (남의 자료를) 긁어오거나 짜깁기한 결과로 보인다”고 말했다.
한국 상황을 알고 ‘촛불 논문’을 썼을까?
한국의 정치 상황이나 촛불 집회의 맥락을 제대로 알지 못한 채 논문을 베꼈다는 정황은 곳곳에서 발견됐다.
학생들의 논문 1쪽, “2017년 3월 10일, 헌법재판소가 박근혜 대통령을 소송했다”라는 문장이 나온다. 이상원 교수 논문의 “2017년 3월 10일, 헌법재판소가 박근혜 대통령의 탄핵소추안을 인용했다”라는 문장을 베낀 것으로 보인다.
이 교수는 ‘탄핵’(impeach)이라고 정확한 용어를 썼지만, 학생들은 ‘소송’(sue)이라는 단어를 사용했다. 탄핵과 소송은 법률적으로 다른 용어다. 법원과 헌법재판소를 이해하지 못한 단어 선택이다.
▲ 학생들의 표절 논문 문장과 이상원 교수의 원논문 문장 비교
이상원 교수는 촛불집회 당시 한국인을 대상으로 설문 조사해 ‘현 정부’에 대한 불만의 정도를 분석했다. 여기서 가리키는 ‘현 정부’는 박근혜 정부를 뜻한다.
그런데 학생들은 이 문장을 베끼면서 ‘현 정부’를 뜻하는 ‘incumbent’라는 단어 대신 ‘new’라는 단어를 썼다. 결국 학생들은 “응답자들은 ‘새(new) 정부’를 향해 큰 불만을 나타내는 경향을 보였다”라는 문맥이 전혀 다른 엉뚱한 문장을 만들었다.
이 때문에 2016년 당시 한국 상황을 알지 못하거나 촛불 집회의 맥락을 이해하지 못 한 사람이 논문을 베낀 게 아니냐는 의심이 든다. 또 미국 인구 분석에서나 나올법한 인종(민족) 분류가 등장하고, 탄핵과 소송을 구분하지 못하는 점에서 한국에 무지한 외국 ‘대필 작가’를 고용한 게 아니냐는 의혹이 제기된다.
뉴스타파는 논문 저자로 이름을 올린 학생들과 학부모에게 질의서를 보내 논문을 실제 누가 만들었는지, 학생들이 90명을 진짜로 조사했는지, 대학 입시에 논문을 활용했는지 물었지만, 7월 5일 오전까지 아무도 답변하지 않았다.
언론에 보도되자 논문은 학술지 홈페이지에서 사라졌다. 처음엔 내용만 숨기고 저자와 논문의 제목은 볼 수 있었다. 나중엔 논문의 흔적을 전부 없앴다. 학술지는 논문을 삭제한 이유를 밝히지 않았다. 이 학술지 홈페이지 정보에 따르면, 논문의 철회 비용은 미화 250달러, 삭제 비용은 450달러였다.
▲ 학생들의 해당 논문은 학술지 홈페이지에서 철회되었고 현재는 완전히 삭제됐다.
뉴스타파가 파악한 학생들의 논문은 25건이다. 이 중, 설문 조사 등 데이터에 기반한 실증 논문은 5건이다. 촛불시위, 자폐 아동, 구강 건강 등 데이터를 수집·연구한 논문이 4편, 혐오범죄 데이터를 수집·분석한 논문이 1편이다. 나머지 논문의 검증 결과는 이번 주 목요일(7월 7일)에 보도할 예정이다.