[IJAsia18] 너도나도 코딩 없이 웹페이지 긁는 법
2018년 10월 16일 11시 32분
일상에서 알게 모르게 접하는 데이터는 탐사보도의 훌륭한 소재가 될 수 있습니다. 비옥한 땅 위에서 자란 나무가 알찬 열매를 맺듯이 ‘좋은 데이터’는 알찬 보도를 뒷받침하는 토대라고도 할 수 있습니다.
빅데이터, 즉 대량의 데이터를 다룰 때 흔히 ‘데이터 마이닝’이란 표현을 사용합니다. 마이닝은 우리말로 ‘채굴’인데요. 일반적으로 쓰는 데이터 ‘검색’ 대신 굳이 데이터 ‘채굴’이란 표현을 쓴 이유가 뭘까요? 우리가 살고 있는 세계에는 상상할 수 없을 정도의 다양한 데이터가 존재합니다. 그런데 각각 따로 떨어져 분산화된 데이터는 아무 의미 없는 숫자 혹은 기호에 불과합니다. 이 데이터들을 수집해 데이터 이면의 가치를 찾고, 숨은 의미를 부여하는 일을 바로 ‘데이터 채굴’이라고 합니다.
10월 5일 개막한 ‘제3회 아시아 탐사저널리즘 총회(IJAsia18)’에서는 데이터 저널리즘 분야의 다양한 세션이 열렸는데, 총회 둘째 날 열린 ‘Money, Politics & Data’(돈, 정치와 데이터)란 주제의 강연은 권력 감시에 관심있는 탐사보도 기자들에게 큰 호응을 얻었습니다.
‘Money, Politics & Data’의 연사로는 일본 NHK 출신이면서 ‘Japan Center for Money and Politics’라는 탐사저널리즘 기구를 이끌고 있는 Tateiwa Yoichiro와 필리핀의 ‘뉴스타파’격인 ‘Philippine Center for Investigative Journalism’의 베테랑 언론인 Malou Mangahas, 말레이시아 탐사저널리즘 단체인 ‘Sinar Project’의 데이터 저널리스트 Khairil Yusof가 나섰습니다. 이들은 정부와 민간 영역에서 생산되는 데이터를 활용해 돈과 정치, 그리고 권력자들이 우리 사회에 어떤 영향을 미치는지 보도해 왔습니다.
첫 번째 연사로 나선 Tateiwa Yoichiro는 “일본의 하원의원, 상원의원, 고위 각료들이 각각 자신의 재산 변동 내역을 일반 시민에게 공개하고 있다”며 “그러나 중앙 정부가 관련 서류를 3년만 보관하는 것은 문제가 있다”고 말했습니다. 또 Tateiwa Yoichiro는 이 문제를 해결하기 위해 일본 주 정부와 중앙 정부에 요청해 관련 서류를 모두 수집했고, 이후 정치인 이름 등을 기준으로 이들의 재산 변동 내역을 검색할 수 있는 시스템을 만들었다고 강조했습니다.
뉴스타파와 코드나무가 흩어져 있는 고위공직자의 재산 정보를 한 곳에서 검색할 수 있도록 하기 위해 ‘고위공직자 재산공개’ 사이트를 만든 것과 같은 취지입니다.
Tateiwa Yoichiro는 자신이 취재 중인 ‘후쿠시마 프로젝트’에 대해 설명하면서 한 대학교수로부터 확보한 미국 정부 데이터 가운데는 후쿠시마 원전사고 직후 주일미국 대사관과 주일미군 부대 인근의 방사능 측정 자료가 있었다는 사실도 밝혔습니다.
Tateiwa Yoichiro에 따르면, 미국 정부는 2011년 후쿠시마 원전 사고 직후 후쿠시마 인근에 살고 있던 미국인들에게 대피하라고 한 반면, 일본 정부는 후쿠시마 방사능 관련 원본 데이터를 공개하지 않은 채 인근 일본인 거주자(군인 포함) 200여명이 암에 걸렸지만 방사능과는 관련이 없다고 주장하고 있습니다. Tateiwa Yoichiro는 “아직 우리는 후쿠시마 사고 당시 무슨 일이 일어났는지 모른다”며 이번 콘퍼런스를 계기로 이 사건이 널리 알려졌으면 좋겠다고 말했습니다.
‘탐사보도의 장인’ Malou Mangahas의 강연도 인상적이었는데요. 그녀는 Telling stories from and Through data(데이터를 통한 스토리 텔링)를 주제로 발표에서 몇가지 생각할 만한 주제도 던졌습니다.
Malou Mangahas는 ‘우리가 왜 탐사보도에서 데이터를 사용해야 하는가’라는 질문에 대해 “만약 우리가 데이터에 기반한 보도를 하지 않으면 ‘사기꾼’이 데이터를 주물러 우리를 속일 것이기 때문”이라고 답했습니다. ‘숫자를 괴롭혀라. 그래야 무언가 고백할 것이다’, ‘숫자는 말을 할 수 없다. 하지만 숫자는 당신의 정보원이 알려주는 것 만큼 알려줄 수 있다.’ ‘숫자와 인터뷰 해라’와 같은 격언도 함께 소개했습니다.
또 Malou Mangahas는 정부의 탄생과 쇠락, 빈부 격차, 평화, 민주주의와 같은 거대 담론이 모두 데이터(통계)와 연결돼 있다고 강조했습니다. 전 세계적으로 2003년부터 최근까지 50억 기가바이트의 데이터가 생성됐고, 오늘도 계속 새로운 데이터가 만들어지고 있다고 설명했습니다. 끝으로 Malou Mangahas는 빠르게 변화하는 사회에서 항상 데이터에 관심을 갖고, 데이터와 데이터를 연결하는 ‘스토리’가 무엇인지 함께 고민해보자고 제안했습니다.
데이터 채굴 ‘능력자’인 Khairil Yusof는 자신이 직접 데이터 채굴을 했던 노하우를 청중들에게 소개했습니다. 그는 여러 곳에 분산된 정보를 구조화해 지속적으로 수집하는 것이 중요하다고 강조했습니다.
예를 들면 (부패 의혹이 있는) 특정 기업에 대한 정보를 구조화하기 위해 홈페이지 등 온라인에 게재돼 있는 여러 정보(이름, 사진 등)를 수집했다가 수개월 뒤 다시 예전의 정보와 지금 정보를 비교해보면 다른 부분이 눈에 띌 것이라고 설명했습니다. 권력자라면 그들의 가족, 협력자, (권력자가 속한) 조직 등에 대한 정보 수집이 필요하고, 조직이라면 경영진, 재무담당자, 협력사 등에 대한 모니터링이 필요하다고 말했습니다.
발표가 끝난 뒤, 한 참석자는 심재철 의원의 기획재정부 자료 해킹 의혹에 대해 질문했는데, 질문 내용에 대한 정확한 배경 지식이 없어서인지 연사들은 정부 사이트가 해킹당했다는 것에 대해 이해할 수 없다는 반응을 보이기도 했습니다.
정리 : 뉴스타파 강현석
뉴스타파는 권력과 자본의 간섭을 받지 않고 진실만을 보도하기 위해, 광고나 협찬 없이 오직 후원회원들의 회비로만 제작됩니다. 월 1만원 후원으로 더 나은 세상을 만들어주세요.