Commons

지금까지 이런 데이터는 없었다: 기초의회 의정감시 데이터 구축 대작전!

2021 커먼즈어워드 열림부문 수상자 '투명사회를 위한 정보공개센터'

김조은 2022년 03월 03일

2022년 1월 18일 제2회 커먼즈어워드 시상식이 있었습니다.
커먼즈어워드는 열림, 다양성, 참여라는 커먼즈의 가치를 실천하는 혁신가에게 사단법인 코드가 감사의 표시로 드리는 상입니다.
이 글은 2021 커먼즈어워드 '열림' 부문 수상자 투명사회를 위한 정보공개센터의 활동가 김조은 님이 공유하는 전국 기초의원 의정감시 데이터 구축 대작전 후기입니다.


image

2021년 11월 1일, 31명의 시민들이 줌으로 만났다. 전국 226개 기초의회 의원들을 감시하기 위한 ‘기초의원 현황 정보’를 모아 데이터셋을 만들기 위함이었다.

각 지역에서 지역운동을 하고 있는 활동가, 기초의회를 감시하고 제대로 일하게 하고 싶은 시민, 데이터 활동에 관심이 있는 대학생, 데이터 분석 연구자와 데이터저널리즘 기자 등등 31명의 배경은 각각 다양했지만, 의정감시 데이터가 모두를 위해 필요하다는 취지에 뜻을 모았다.

다 같이 하면 가능할지도 몰라! 기초의원 데이터 구축 대작전의 서막

cover

<전국 기초의원 의정감시 데이터 구축 대작전>을 기획한 투명사회를 위한 정보공개센터는 모두의 ‘알 권리’를 위해 공공정보를 공개시키고 공유하는 활동을 하고 있는 시민단체다. 삶에 중대한 영향을 미치는 정책결정을 비롯해 행의정의 정보가 시민들에게 투명하게 공개될 때, 더 많은 민주주의가 가능하고 보다 좋은 사회가 만들어진다는 신념을 가지고 5명의 활동가가 700여명 회원의 후원으로 일하고 있다.

2008년 창립이후 13년 동안 정보공개 활동을 지속하다보니, 더 정교하고 지속적인 형태로 정보를 축적하고 가공해야 할 필요가 있었다. 특히 데이터를 활용해 사회 문제를 분석하고 해결하는 시빅해커들이나 데이터저널리즘과 종종 협업을 하게 되면서, 구조화된 정보들이 잘 쌓이면 해당 주제에 대해 좀 더 정확하고, 풍부한 분석을 할 수 있다는 것을 체감하게 되었다. 때문에 정보공개센터는 데이터를 수집하고, 가공하고, 공유하는 활동에 점점 더 많은 노력을 기울이고 있다.

기초의회 및 의원에 대한 정보는 행의정 감시를 위해 꼭 필요하지만 제대로 정리되어 있지 않은 분야였다. 심지어 2021년은 지방자치가 출범한지 30주년이 되는 해였는데, 지방의회에 대한 정보가 각 지자체별로 모두 흩어져 있었기 때문에 통합적으로 제도를 분석이나 평가하는 것이 어려운 상황이었다. 그 동안 각 지역에서 지방의회를 모니터링하고 내실화하려는 노력은 꾸준히 있어왔지만, 각 지역을 비교분석 하거나, 기초의회 제도를 심층적으로 탐구할 수 있는 데이터는 없었다.

하지만 226개 기초지자체, 3000명 가까이 되는 의원의 데이터는 한두명이 정리하기에는 엄두조차 나지않는 작업량이었다. 데이터 작업을 함께할 사람들을 찾아나섰다. 사실 콘텐츠 자체를 익명의 시민들과 같이 만드는 건 처음이라 많은 응답을 기대하진 않았다. 그런데 웬걸? 예상 밖으로 “같이 하실분!” 이라고 외치자, 열흘 만에 31명의 시민들이 모였다.

함께 만들 데이터는 이것(이었지만..)

이번 프로젝트를 통해 우리가 함께 만들고자 한 기초의원의 데이터셋은 선관위의 민선7기 당선자명부와 함께 1) 226개 기초의회 2927명 의원의 상세이력과 2)겸직신고 현황 3)각 기초의회에서 의결한 징계내역 4)기초의원들의 2021년 재산신고내역이었다.

상세이력의 경우 각 기초의회 홈페이지 의원현황의 프로필에서 복사하여 붙여넣는 작업이 필요했고, 겸직신고 현황은 정보공개청구한 겸직 신고서의 내용을 직접 스프레드시트에 입력하는 작업, 징계내역은 정보공개청구자료 입력과 관련 기사 링크를 검색해 첨부하는 작업, 2021년 재산신고내역은 매년 3월 전국 광역시도 관보에 올라오는 개인별 재산 신고서류를 데이터형태로 정제하는 작업이 필요했다.

데이터구축 대작전을 본격적으로 시작하기에 앞서, 정보공개센터는 ‘오픈데이터포럼’의 ‘가을 데이터 스프린트 프로젝트’를 통해 전문가 자문을 받고 사전 준비를 할 수 있었다. 이미 행의정 감시 데이터를 다년간 구축하고 업데이트하고 있는 뉴스타파 데이터팀의 김강민 기자와의 논의를 통해 데이터의 항목과 구조를 정하고, 공공기관의 홈페이지 및 데이터 분석에 많은 경험이 있는 박조은 개발자와 함께 가장 효율적이고 적절한 정보수집 방법을 논의했다. 홈페이지에 있는 각 의원의 프로필 정보를 코딩으로 쉽게 가져올 수 있을 지를 타진해보았지만, 각 기초의회마다 홈페이지의 구조가 달라 수동으로 긁어오는 것이 더 효율적인 상황이었다. 겸직현황의 경우 모든 항목에 대해 제대로 목록을 만들어 현황을 관리하는 지자체가 거의 없어 각 의원들이 수기로 적어 제출한 원본 서류를 받아 입력해야 했기 때문에 더 많은 시간이 필요했다. 재산신고 내역의 경우 17개 시도관보에 기초의원들의 재산내역이 흩여져 있는데, 관보를 데이터 형태로 변환하는 것부터 문제가 있었다. 숫자를 읽을 수 없는 이미지 파일들이 많았고, 특히 가로형태로 이미지화 되어있는 경우 OCR작업도 불가능했기 때문에 재산내역은 우선순위에서 제외하기로 했다.

겸직현황과 징계이력 등 정보공개청구가 필요한 자료들은 미리 청구해 수집하고, 다른 시민단체에서 가지고 있던 청구 자료나 선행 데이터들도 모아 참조했다. (추후에 기초의회와 관련한 새로운 데이터를 만들고자 하는 사람들에게 우리의 작업도 큰 도움이 될 수 있을 것이라 기대한다.)

시민들이 다같이 만드는 데이터, 이것이 중헌디.

이렇게 준비를 마치고 31명의 사람들이 모여 협업을 시작했다. 여러 사람들이 같이 작업해서 결과물을 잘 만드려면 규칙이 무엇보다 중요했고, 이를 잘 전달하기 위해서 매뉴얼을 만들었다. 하지만 모두가 규칙에 맞게 데이터를 입력하는 것 보다 더 중요한 것이 있었는데, 우리가 최대한 이 프로젝트에 대해 애정을 가지고 끝까지 함께 하는 것이었다. 자발적으로 모인 사람들이 서로 일을 분담하여 진행하다보면 여러가지 이유로 중도에 포기하거나 아예 연락이 두절되는 사람들이 생기기 마련이다. 특히 데이터를 일일이 입력하는 ‘노가다’ 작업은 지치고 힘든일이기 때문에 끝까지 함께 작업을 마무리 하는 것은 생각보다 그리 쉽지가 않다. 각자의 상황에 따라 기여를 하면서도 우리가 끝까지 프로젝트를 함께 잘 마무리하려면 무엇이 필요할까? 여러가지 방법과 전략이 있겠지만, 우리는 이 프로젝트의 의미와 결과에 대한 상을 함께 생각하고 결정해 나가는 것이 가장 중요하다고 판단했고, 첫 모임을 통해 협업을 위한 몇가지 규칙을 정했다.

오픈채팅방에서 공지사항 전달과 이슈에 대한 소통을 상시적으로 공유하기로 하고, 매주 월요일 줌 회의를 열어 가능한 사람들은 같이 진행상황과 질문, 상세한 기술 규칙 등에 대해 논의하기로 했다. 이를 원활하게 하기 위해 ‘오류 및 논의사항 업데이트’ 시트를 만들어 사안이 있을 때마다 같이 공유하고 업데이트 하면서 작업을 진행했다. 진행에 대한 기본적인 규칙 이외에도, 데이터 정확성 보증방법이나, 데이터셋을 만든 후 결과물은 어떻게 공유할 예정인지, 추후에 분석과 시각화를 할 수 있는 방법은 어떤 것이 있을지, 향후 데이터 업데이트는 어떻게 진행할지 등을 함께 논의하고 결정했고, 이탈을 하는 사람들 대신 새로운 사람들이 합류하게 될 때에도 충분한 논의를 우선적으로 진행했다.

image

이렇게 한달 동안 함께 작업을 진행하면서 25명의 시민들이 함께 상세이력과 겸직현황, 징계이력에 대한 데이터작업을 완료할 수 있었다. 일정상 맡은 부분을 마무리 할 수 없는 사람들이 있을 때에는 작업을 빨리 완료한 사람들이 더 품을 내어 도왔고, 데이터 분석에 도메인 지식이 있는 참여자는 검증작업을 함께 진행하기도 했다. 실제로 작업을 진행하면서 데이터 검증에 생각보다 많은 시간이 소요됐는데, 정보공개센터와 자문단이 데이터 취합과 연결, 검증을 맡아서 진행했지만 수기 문서가 원자료인 겸직현황 같은 경우에는 핵심 참여자들이 검수작업을 분담해 한번씩은 크로스체크를 할 수 있었다.

어렵게 모은 기초의회 데이터, 풀뿌리 정치 쇄신의 씨앗이 되길

예상하긴 했지만 기초자치단체의 데이터를 모으면서 각양각색의 사례들을 볼 수 있었다. 지자체 고유의 예산, 고유의 방식으로 운영되는 웹사이트들은 보안 표준이 지켜지는 곳, 지켜지지 않는 곳이 다 달랐고, 의원 프로필을 이미지로 박아놓은 곳도 있었으며, 똑같은 정보공개청구에도 공개의 수준이 저마다 달랐다. 특히 겸직신고서의 경우 의원들이 수기로 작성하도록 하고 있어 글씨를 알아볼수 없는 경우도 많았다. 통합적으로 운영되는 것까지는 아니더라도, 기초의회가 가진 역할이 같고 생산하는 정보들이 비슷하다면 정보 생산 단계에서 어느정도의 표준화와 전자화는 꼭 필요하다는 것을 느꼈다. 웹사이트 제작 시에 표준적인 모델을 제시한다거나 겸직현황의 경우에는 신고양식을 표준화하고 의회사무국에서 DB 형태로 보유하는 것이 필요하지 않을까. 올해부터는 겸직현황이 각 의회 홈페이지에 사전 공개될 예정인데, 공개의 수준과 형태가 다 다를 것 같아 벌써부터 걱정스러운 것이 사실이다. 시민들이 좀 더 쉽게 기초의회 정보를 모으고 활용할 수 있도록 행안부 등의 주무부처에서 좀 더 적극적으로 나서길 기대한다.

지방자치 30주년이었던 2021년, 지금까지 세상에 없었던 기초의원 통합 데이터를 시민들 스스로 만들었다. 그 와중에도 기초의원들의 도덕적 파문이나 이해충돌 문제는 끊이지 않고 이어졌다. 정보가 없고 관심에서 멀어진 사이에 시민들이 기초의회에 느끼는 정치적 효능감과 신뢰는 처참한 수준이 되었지만, 그렇다고 해서 지방자치 제도가 중요하지 않은 것은 아니다. 정치, 경제, 문화적인 동력과 관심이 모두 중앙에 쏠려있는 한국의 지형에서 지역공동체를 위한 정치는 어느때보다 중요해지고 있다. 지방의회가 토호들의 이권다툼의 장이 아니라 지역 공동체를 위한 정치의 장으로 쇄신하길 바라며, 현실 지방의회의 문제를 파헤치는데에 우리의 데이터가 널리 활용되었으면 한다.

조만간 우리가 구축한 데이터셋으로 재밌는 분석작업을 기획하고 있는데 기초의회와 지역정치에 관심을 가진 동료 시민들을 초대할 예정이다. 하반기에는 올해 6월 제8회 지방선거를 맞아 업데이트 작업도 진행한다. 올해는 더 재밌게 잘 할 수 있을 것 같다.

“함께하실 분!”

image

기초의회 의정감시 데이터 구축 대작전 깃허브 바로가기