‘데이터’저널리즘에서 데이터는 핵심 요소이다. 데이터 확보를 위해서는 다양한 방법과 정보원이 활용되는데, 그 중 대표적인 것이 국가통계포털에 공개된 통계자료, 공공데이터포털에 공개된 원본 데이터 등이다. 오픈API나 크롤링을 통해 데이터를 수집하기도 하고, 관보나 각종 보고서와 같이 온·오프라인에 공개되어있는 문서도 주요 정보원이 된다. 드물지만 자체적으로 데이터셋을 구축하는 경우도 있다.
정보공개청구를 통한 데이터 수집
위에 나열한 방법 등을 통해 원하는 정보를 구할 수 없다면 해당 정보가 정부, 국회, 대법원, 지방자치단체와 같은 공공기관 내부에 존재할 가능성을 생각해볼 수 있다. 이런 이유로 '공공기관의 정보공개에 관한 법률'(이하 정보공개법)에 근거한 정보공개청구도 데이터 수집 방법으로 꾸준히 활용된다. 공공기관이 직무상 보유·관리하지만 공개되어 있지 않은 정보에 합법적으로 접근할 수 있기 때문이다.
대한민국 국민이라면 누구나 공공기관에 정보의 공개를 청구할 수 있다. 청구 방법은 간단하다. 정보공개포털(국회, 대법원 등은 별도 홈페이지를 이용)을 통해 신청하면 된다. 다만 청구 방법이 간단한 데 비해, 경우에 따라서는 청구한 자료를 입수하기까지 순탄치 않은 과정이 기다리기도 한다. 청구가 접수된 다음부터 청구 내용을 두고 공공기관과의 줄다리기가 시작되기 때문이다.
"어디에 쓰이는 겁니까?"
정보공개를 청구한 뒤, 피청구기관의 담당자로부터 종종 받는 질문이다. 결재권자에게 보고하는 데 필요하다며 청구 목적을 묻거나, 청구인의 소속과 직업을 묻기도 한다. 정보를 공개해야 할 피청구기관에서 오히려 청구인에게 정보를 요구하는 당혹스러운 상황이다. 몇 년 전 일이긴 하지만 소속과 청구 목적을 밝혀야 정보를 공개하겠다고 이야기한 기관도 있었다.
하지만 정보공개법에 청구인이 소속이나 청구 목적을 밝혀야 한다는 조항은 없다. 정보공개법에 의하면 공공기관이 보유·관리하는 정보는 공개 대상이고, 다만 그 정보가 정보공개법 제9조 제1항 각 호에 해당할 때만 비공개 할 수 있다고 정하고 있을 뿐이다.
‘공개’ 결정 통지를 받아도 안도하기에는 이르다.
공공기관으로부터 정보 ‘공개’ 결정 통지를 받았다 하더라도 안도하기에는 이르다. ‘공개’ 통지를 받았는데 실제 공개 자료는 청구 내용 중 일부만 공개한 ‘부분공개’ 수준이거나, 사실상 공개한 내용이 없는 ‘비공개’ 수준인 경우도 있기 때문이다. 청구한 것과 다른 형식으로 자료를 공개하는 경우도 있다. 실제로 보고서에 대해 ‘공개’ 결정을 내렸는데 정작 중요한 내용은 확인할 수 없도록 내용을 가리고 PDF로 문서를 변환해 공개하는가 하면, 분명 전자파일 형태로 공개를 청구했는데 자료를 인쇄물로 출력해서 등기우편으로 보내온 사례도 있었다.
또 전자파일 형태로 자료를 공개했다 하더라도 청구 항목 중 일부가 누락돼 있거나 자료에 오류가 있는 경우도 흔하다. 이럴 땐 정보공개 담당자에게 누락된 정보의 보완이나 오류에 대한 확인을 요청하기도 하는데, 이 때 걸리는 시간이 정보공개 결정까지 걸린 시간보다 더 길 수도 있다.
한 가지 사례로 KBS 데이터저널리즘팀에서 제작해 공개했던 전국 유치원·초·중·고등학교 석면 지도를 들 수 있다. 지도에 사용된 데이터는 전국 각 시도 교육청에 대한 정보공개청구를 통해 입수했다. 모든 기관에서 ‘공개’ 결정 통지를 했지만, 전자적 형태로 정리된 자료가 없다며 이미지 형태의 PDF로 자료를 공개한 기관이 있어 데이터를 정리하는 데 애를 먹었고, 데이터에서 크고 작은 오류도 발견돼 담당자에게 확인을 요청해가며 오류를 바로잡아야 했다. 자료의 취합과 분석 과정에서 필요한 정보가 생기면 자료를 추가로 청구해 시간이 더 소요되긴 했지만, 분석에 활용할 수 있는 수준으로 데이터를 정리하기까지 4개월 정도가 걸렸다.
예상할 수 없는 결과와 비공개 사유
여러 건의 정보공개를 청구하다 보면 당연히 공개될 정보라고 생각했는데 비공개 또는 부분공개 되는 경우가 있다. 대부분의 지방자치단체에서 정보를 공개했는데, 특정 지방자치단체에서만 비공개 결정을 내리고 이의신청마저 기각하는 예상치 못했던 일이 벌어지기도 한다.
비공개 결정통지서에서 납득하기 어려운 사유를 제시하는 경우도 있다. 법에서 공개 대상 정보라고 적시한 사항인데 개인정보에 해당한다며 정보를 비공개하기도 하고, 역시 법에서 공개하도록 정하고 있는 내용인데 해당 정보가 공개되면 지역주민의 불안감을 조성하거나 지역개발이 제한될 수 있다며 정보 공개를 거부한 경우도 있었다.
가공·취합하여야 하는 정보이므로 해당 기관이 보유·관리하는 정보가 아니라는 문구도 종종 접하게 된다. 전자적 형태로 데이터가 존재하는데 여기에서 데이터 일부를 추출하는 것이 가공 또는 새로운 정보의 생산에 해당한다는 것이다. (이에 대해서는 대법원 판례를 참조할 수 있다: 대법원 2010.2.11. 선고, 2009두6001 판결).
'비공개' 결정이나 '정보 부존재' 통지를 받은 다음에는 경우에 따라 법령이나 판례 등을 근거로 왜 이 정보가 공개되어야 하는지 혹은 존재할 수밖에 없는 정보인지 설명하고, 피청구기관의 주장을 반박하는 일이 이어진다. 지난한 과정이다. 통화를 하며 상대방을 설득하기도 하고, 이의신청도 한다. 이의신청이 기각되면 행정심판을 청구하기도 하는데, 정보를 받는 데만 수 개월에서 일 년 가까이 걸리기도 한다.
그래도 시도할 이유는 충분하다.
정보공개청구를 통해 데이터를 수집하는 방법은 시간 측면에서는 효율적이지 않을 수도 있다. 모든 청구 내용에 대해 공개 결정이 내려지는 것도 아니다.
하지만 정보공개청구는 공공기관 내부에 있던 정보를 기관 밖으로 이끌어낼 수 있는 효과적인 방법이다. 이렇게 공개된 정보는 때로는 정보 그 자체만으로 새로운 사실이 되고, 데이터에 대한 분석을 거치면 더 많은 정보와 의미를 드러내기도 한다. 정보 비공개 또는 부존재 통지 역시 그 자체로 의미를 가질 때도 있다.
그래서 시도할 이유는 충분하다. 비록 정보공개청구는 시간도 많이 걸리고 세련된 방식의 데이터 수집 방법도 아니지만, 이를 통해서만이 구할 수 있는 정보가 있기 때문이다. 데이터저널리즘의 한편에서 정보공개청구가 앞으로도 계속 활용될 것이라고 생각하는 이유이다.
글쓴이 윤지희 데이터 분석가는 KBS 데이터저널리즘팀에서 데이터의 수집과 분석을 담당하고 있다.