데이터

'뉴스타파 데이터포털' 오픈...한국 언론사 최초

2019년 09월 03일 07시 59분

한국탐사저널리즘센터-뉴스타파는 독립언론 협업공간인 ‘뉴스타파 함께센터’ 개소에 발맞춰 뉴스타파가 수집한 각종 데이터를 누구나 열람하고 다운받을 수 있는 ‘뉴스타파 데이터포털’ 사이트 (https://data.newstapa.org)를 제작해 오픈합니다. ‘뉴스타파 데이터포털’에는 지난 2012년 뉴스타파 출범 이후 지금까지 뉴스타파 취재진이 탐사보도 프로젝트를 수행하면서 수집, 정제해 뉴스 및 프로그램과 함께 웹사이트에 공개한 데이터뿐만 아니라 그 동안 뉴스타파가 취재 과정에 입수했으나 웹사이트에는 공개하지 않았던 데이터를 포함해 수십 건의 데이터 세트가 수록돼 있습니다.

뉴스타파는 수많은 시민들의 후원으로 운영되는 비영리 독립탐사매체인만큼 취재 과정에서 수집한 데이터는 우리 사회의 공적 자산이라는 판단 하에 기사와 관련된 데이터를 해당 기사와 함께 공개하는 것을 원칙으로 삼았습니다. 또 데이터 양과 중요도, 활용도에 따라 별도의 특별 사이트를 제작하기도 했습니다. 고위공직자 재산정보 공개 사이트가 대표적입니다. 이 재산 사이트는 정부, 국회, 사법부 등이 별도로 공개하는 고위공직자들의 재산 내역을 한곳에 집약해 시민들이 쉽게 찾아볼 수 있도록 한 게 특징입니다. 또 20대 국회의원 예산 사용내역 공개 사이트를 제작해 국회의원들의 특정업무경비, 국회 특수활동비 내역 데이터 등도 공개했습니다. 대표적인 데이터는 아래와 같습니다.

- 고위공직자 재산 정보 공개 https://jaesan.newstapa.org
- 국조특위 불출석 사유서 전수 공개 http://apps.newstapa.org/liar/
- 내차결함 https://checkyourcar.newstapa.org/
- 20대 국회 예산 사용내역 공개 https://moneytrail.newstapa.org
- 긴급조치위반 사건별 판사와 판결 http://pages.newstapa.org/judgement-list/
- 노무현 대통령의 친필메모 http://pages.newstapa.org/n1904/

‘뉴스타파 데이터포털’을 통한 한국탐사저널리즘센터-뉴스타파의 취재 데이터 공개는 시민들에게 공공 데이터를 직접 열람하고, 다운받아 이를 검증해 볼 수 있는 기회를 제공합니다. 또 이런 과정을 통해 시민들의 공적 데이터 접근성을 높이고, 알권리를 확장해 궁극적으로 우리 민주주의가 성장하는데 보탬이 될 것으로 기대됩니다. 현재 ‘뉴스타파 데이터포털’에는 모두 57건의 데이터 세트가 올라와 있습니다.

▲ ‘뉴스타파 데이터포털’ 첫화면 5가지 태그 분류 아이콘 배치

키워드 검색과 태그 분류

‘뉴스타파 데이터포털’ 사이트에서는 검색창에 키워드를 입력해 원하는 자료를 찾을 수 있습니다. ‘고위 공직자 재산'이란 키워드를 검색창에 입력하면 ‘고위공직자 재산 공개 내역' 뿐만 아니라 ‘원자력 관련 주요 기관장 재산현황', ‘고위공직자 재산 공개 신고 내역 순위(2013)’ 등 제목과 설명글에 입력한 키워드가 포함된 자료들을 찾을 수 있습니다.

검색을 돕기 위해 자료의 출처와 내용에 맞춰 태그도 입력돼 있습니다. ‘20대 국회의원 예산 사용내역' 데이터 세트에는 국민의 세금이 사용된 자료이기 때문에 ‘세금'이란 태그를 입력했습니다. 데이터 설명글 하단에 배치된 태그 키워드를 클릭하면 해당 키워드로 분류된 데이터들을 볼 수 있습니다. 시민들의 관심이 높은 ‘국회', ‘사법', ‘세금', ‘안전', ‘교육' 등의 태그가 입력된 자료들은 첫 화면에 분류 아이콘을 배치해 관련 자료들을 쉽게 찾을 수 있도록 했습니다.

UTF-8 방식으로 인코딩된 기계가독형 자료

뉴스타파 데이터 포털에 업로드된 자료들은 UTF-8 인코딩 방식과 기계가독형 자료(Machine-Readable data) 형식인 csv, xml, json 파일 형식이 기본 규격입니다. 뉴스타파가 직접 수집·정제해 작성한 자료가 아니라 정부 기관 등으로부터 공개 받은 자료로 원본 파일 형식이 xlsx 또는 pdf 형식인 자료들은 원본 파일 형식을 그대로 업로드했습니다. 자료에 따라서는 뉴스타파가 편집한 csv 파일 등도 함께 업로드돼 있습니다. 파일이 csv 와 pdf 형식인 자료는 웹브라우저에서 미리보기 기능이 지원돼 파일을 다운로드 받아 열지 않아도 내용을 확인할 수 있습니다.

▲ 국가보훈처 나라사랑 교육 전문강사진 명단 2012 ~ 2015년

업데이트된 자료는 한 곳에서

시기에 따라 업데이트된 자료는 한곳에서 볼 수 있도록 구성했습니다. 뉴스타파가 연속 보도했던 국가보훈처의 나라사랑 교육 보수 편향 보도에 활용된 강사진 명단은 2012년부터 2015년까지의 데이터를 한 페이지에서 비교 확인할 수 있도록 구성했습니다.

▲ 20대 국회의원 예산 사용내역 데이터 활용사례

데이터 활용사례 링크

페이지 하단에 데이터 활용 사례 연결 링크를 배치했습니다. 이용자들은 활용 사례를 통해 해당 데이터가 뉴스타파의 취재와 보도에서 실제 어떻게 사용됐는지 확인할 수 있습니다. 활용 사례에는 뉴스타파의 보도뿐만 아니라 뉴스타파의 데이터를 활용해 보도한 타 언론사 기사 등도 함께 게시돼 있습니다. 첫화면 상단 오른쪽에 위치한 ‘활용사례' 메뉴를 클릭하면 ‘뉴스타파 데이터포털’에 업로드된 자료들이 어떤 보도에 활용됐는지를 보여주는 활용 사례 전체 목록을 볼 수 있습니다. ‘뉴스타파 데이터포털’에 수록된 데이터 세트를 활용해 콘텐츠를 생산하고 그 결과물을 활용 사례에 추가하고 싶다면 data@newstapa.org로 메일을 보내 추가할 수 있습니다. 시민 여러분들의 많은 관심과 활용 바랍니다. 뉴스타파는 ‘뉴스타파 데이터포털’에 새로운 공적 데이터를 계속 업데이트 할 예정입니다. ‘뉴스타파 데이터포털’과 함께 데이터 기반 탐사저널리즘으로 세상을 더 나은 방향으로 함께 바꿔나갈 수 있으면 좋겠습니다.

관련뉴스

최신뉴스