Keynote

Commons Pub 1811 미디어, 팩트, 데이터 with 이종호, 김준일

사실을 단순히 있는 그대로 받아 적는 것이 아니라, 사실인지 아닌지를 밝히는 '방법'이 발전해야 한다.

E Editorial Team 2018년 11월 30일

11월의 커먼즈펍에서는 초대손님은 뉴스톱의 김준일 대표와 오마이뉴스의 이종호 기자를 모셨다. 김준일 대표는 2001년 경향신문에 입사해 사회부, 경제부, 편집부 등에서 일하다가, 2017년 6월 팩트체크를 전문으로 하는 뉴스톱(News ToF)를 설립했다. 이종호 오마이뉴스 데이터저널리즘 담당기자는 2000년 오마이뉴스 창간 멤버로, 2016년 ‘19대 국회의원 정치자금 내역 공개’로 한국기자협회 이달의 기자상 수상했다.


1. 이종호: 정치자금과 데이터저널리즘

오마이뉴스에서 12~14년 19대 국회의원 정치자금 지출내역 데이터 368148건을 CSV로 GitHub오마이뉴스에 공개했다. 정보공개 청구를 하면 보통 2주 정도 걸리는데, 국회의원 정치자금에 관한 정보는 한 달이 걸린다고 한다. 그런데 PDF 파일 3백 개를 보내줬다.

그런데 그 파일 속 지출 세부항목 형식이 전부 다르고, 표준이라는 것이 정해져 있지 않고 각자 방식대로 기록해두었다. 더 어처구니 없는 것은 중앙선관위에서는 신청하기 전에는 가지고 있지 않다. 정보공개청구가 들어오면 중앙선관위에서 지역선관위에 제출하라고 요구하고, 지역선관위가 팩스로 보내준 것을 PDF로 만들어서 건네준다는 것이다. 그러다보니 2012, 13년 까지만 해도 육안으로 읽을 수 없는 자료가 많았다.

300명 조사에서 10-15%는 페이지 누락이 생기고, 선관위에 말하면 원본을 버렸다는 말도 한다. 선관위에서도 엑셀 데이터로 받고 싶어하지만, 국회의원이 법을 바꿔주지 않아 여전히 종이로 받는다.

광학문자인식(Opticl Character Recognition) 프로그램인 ABBYY FineReader를 사용해서 PDF를 엑셀로 전환하는데, 이 때 팩스나 복사 과정에서 생긴 점 따위로 인해 특수문자들이 발생한다. 그걸 일일이 지워줘야 하고, 오류가 생긴 엑셀 데이터를 클리닝해줘야 한다. 또한 날짜와 시간, 지출항목, 지출액, 사용처도 모두 그렇게 정제해야 하고, 사업자번호, 전화번호는 개인정보이기 때문에 일일이 제거해야 한다. 데이터시각화에서 관심이 많은 건 주소일텐데, 주소는 확인대조가 힘들어서 정제를 하지 못한다.

image

그 후에 총연번, 의원번호, 이름, 당, 당ID(같은 당인데 이름이 자주 바뀌기 때문에 아이디를 부여하지 않으면 다른 당으로 분류되기 때문에 사용한다), 지역국, 분류기준 등을 추가한다. 지출 내역은 11개 대분류와 51개 소분류를 했는데, 가령 '간담회'라는 대분류 항목 아래에는 '다과, 식대' 등으로 소분류된 항목이 있고, '교통'이라는 대분류 항목 밑에는 '철도, 택시, 항공, 해외출장' 등의 소분류 항목을 두었다.

청구에 1개월, 데이터 정제하는 데 3개월, 기사화하고 사이트를 구축하는 데 다시 1개월이 걸린다. 정보공개 청구에 들어간 금액은 5백 7십 만 원. 우리가 찾아낸 지출 건수는 83만 건이었고, 6년 동안 국회의원들이 약 3천 억 원을 썼으니, 국회의원 전체가 1년에 사용하는 비용은 약 3,4백 억 원 정도이다. (첫 공개 때 받은 의견 중에는 공개한 액수가 많은 건지 적은 건지 기준이 없어서 체감이 되지 않는다는 것도 있었다).

친박 등의 “실세”라는 사람들은 고액 후원자가 많고, 대중적인 인기를 누리는 정치인은 소액 후원이 대부분

첫 공개 때는 선관위에서 사이트 내리라고 압력이 들어왔다. 이유는 개인정보 유출이라는 것. 그리고 우리가 돈 받고 준 정보를 왜 무료로 풀었느냐는 것이다. 내리지 않고 버텼더니 소송으로 가지 않고 넘어갔다.

깃허브에서 언제든지 엑셀 파일로 다운로드 받을 수 있게 했더니, 각종 지역지, 전문지에서 데이터를 들여다 보고 그것을 토대로 기사를 냈을 뿐 아니라(미디어오늘, "기자들과 가장 밥 많이 먹은 의원은"), 개인들도 그 자료를 받아 데이터 시각화를 해서 보여주기도 했고, 심지어 특정 정치인의 지지클럽에서 상대 후보의 정보를 다운로드 받아 상대 후보의 약점을 찾는 데 사용하기도 했다.

정치자금 데이터 공개의 문제점과 개선점

  • 그림 파일이 아니라 데이터로 받을 수 없을까?
  • 더 빨리 받을 수 없을까?
  • 유권자/독자의 이해도와 활용도를 높일 수 있는 방법은?
  • 계속된 감시로 씀씀이가 깨끗해지고 있다. 그렇다면 우리는 이것을 계속 할 수 있을까?
  • 의원정보 API로 실시간 업데이트하는 방법
  • 사업자등록번호 연동 등의 모색

2. 김준일: 팩트체크 저널리즘 현황과 과제

뉴스톱은 필자의 경력도 투명성의 일부로 생각하고 경력을 웹사이트에 공개한다. 팩트 체크에 앞서 누가 체크를 하는지 밝히는 것이 투명성이기 때문이다.

객관주의 저널리즘과 팩트체크

사실을 있는 그대로 받아 적는 것이 아니라, 사실인지 아닌지를 밝히는 '방법'이 발전해야 한다.

미국에서는 조지 H. W. 부시가 선거운동 중에 거짓말에도 불구하고 당선 된 후 그의 말을 검증하지 못한 언론사의 반성이 있었다. 1992년 CNN에서 Adwatch로 팩트체크라는 포맷이 시작된 후로 언론에 팩트체크

  • 1992년 CNN Adwatch
  • 2003년 Factcheck.org
  • 2007년 Politifact.com
  • 2007년 WP The Fact Checker

팩트체크 원칙규정: IFCN Code of Principles

미국의 저널리즘 스쿨인 Poynter Institute가 운영하는 International Fact-Checking Network (IFCN)은 팩트체크의 원칙을 다음과 같이 다섯개로 규정하고 있다:

  1. 비당파성 "Checking all sides."
  2. 소스의 투명성 "Fact-checkers must show their evidence."
  3. 펀딩과 조직의 투명성 "The public should know who runs the project and how it is supported."
  4. 방법론의 투명성 "How the fact-checking is conducted should be clear."
  5. 열린, 정직한 정정 "Fact-checkers should be commited to corrections."

뉴스톱이 추구하는 팩트체크 저널리즘은 투명한 저널리즘, 맥락 저널리즘, 지식 저널리즘, 협업 저널리즘이다. 현재 29명/기관이 뉴스톱의 팩트체커로 협력하고 있다. 현재 한국에는 IFCN에 멤버(verified signatory) 자격을 얻은 언론사가 하나도 없다. 뉴스톱도 IFCN 멤버로 등록하려고 했다가 탈락했는데, 펀딩이 없다는 이유가 컸다. 수입원이 투명해야 영향을 받지 않는 팩트체커로 인정할 수 없는데, 현재 뉴스톱이 그런 수입원이 없기 때문이다.

문재인 미터

미국 폴리티팩트의 "Trump-o-meter"의 형식으로 문재인 정부의 공약 이행을 체크하는 문재인미터를 사단법인 코드와 협업을 통해 만들었다. 여기에서 체크하는 세부 공약은 약 900개이지만, 현재 문재인 정부가 공약을 거의 지키지 않고 있다.

image

팩트체크의 한계

트럼프 지지자들은 기자들과 소통을 하지 않는다. 네트워크가 연결이 되지 않기 때문에 팩트체크를 해도 전달이 되지 않는다. 팩트를 체크하면 중도적 유권자의 태도를 바꾸는데는 소용이 있었지만, 골수 지지자들에게는 소용이 없다.

영국 정부는 fake news라는 말을 쓰지 않고, disinformation/misinformation이라는 용어로 통일한다.

뉴스톱의 과제

  • 다른 미디어와 협력강화
  • 전문가 네트워크로 발전
  • 안정적 운영재원 확보
  • 비영리법인 전환 검토

cover