COWORKER로고

데이터기반 입법수요 예측 모형 개발 및 고도화

방송·통신·정보 정보

  • 저자

    현준원

  • 발행기관

    경제·인문사회연구회

  • 발행연도

    2023 년

  • 작성언어

    Korean

  • 자료형태

    일반연구보고서

  • 조회수 247
  • 공유 6

부가정보

국문 초록 (Abstract)

본 연구에서는 입법·법제 분야와 관련된 언론기사를 보다 정확하고 빠르게 분류하며, 국회 의안정보를 토픽모델링을 활용하여 내용 기반으로 분석하고, 이외의 데이터를 연계하여 입법수요를 예측함으로써 시의성 및 증거에 기반한 법제 연구와 입법 지원 연구에 기여하는 기초자료 생산, 지역, 재정, 인구감소 등 각종 국정현안과 관련된 입법수요에 대응하는 미래예견적 국정 관리 지원을 목표로 하고 있다. 2023년 6월 20일을 기준으로 제21대 국회에 접수된 법률안은 22,113건으로 이 중 의원발의안은 20,494건에 달할 만큼 입법활동은 증가하고 있다. 이와 같은 입법활동의 양적 증가는 실무적으로 입법심사과정의 부담이나 법령체계정비 등의 문제로 이어지며, 그러므로 국회에 제안된 법률안 중 어떤 법률안을 더 신속하고 중점적으로 심사할지, 제안된 법률안에서 어떤 점을 더 보완할지를 보다 데이터에 기반하고 체계적으로 파악할 필요가 있다.
이를 위해서 먼저 2장에서 수집한 한국언론진흥재단 빅카인즈 언론데이터에서 학습&테스트 데이터셋을 구축하여 법제・입법 이슈와 관련성 판단 및 분류 문제를 연구했다. 서포트 벡터 머신(SVM), 판별분석모형, 로지스틱회귀모형, 나이브 베이즈(NB), 랜덤포레스트, AdaBoost, XGBoost 알고리즘을 적용했을 때 XGBoost 모형이 가장 잘 해결하는 것을 확인하였다. 연구 과정에서 데이터셋은 두 가지 버전으로 나뉘었는데, 학습 및 테스트 데이터셋이 어떻게 구축되느냐에 따라 분석결과가 일부 상이하여 데이터 전처리와 라벨링이 연구에 중요한 영향을 미치며 이에 대해서 계속된 보완이 필요할 것으로 보인다. 3장에서 국회는 입법데이터에서 내용기반의 분류기준을 마련하는 연구에서는 파라미터 튜닝을 적용한 토픽모델링(LDA) 분석으로 지역(균형)발전, 인구감소, 재정수반과 같은 목표 토픽들이 안정적으로 관측됨을 분석했다. 이 연구결과를 보완하여 국회 의안정보시스템에 검색기능에 적용한다면 보다 편리하고 정확한 의안정보시스템 검색이 가능할 것으로 예상된다. 4장에서는 이 결과를 바탕으로 입법수요 예측모형 탐색을 파일럿 연구로 수행하여, 목표 토픽들과 도로/교통/운송, 문화/체육, 국민연금/건강보험/보장성과 같은 토픽을 가지는 정책분야의 입법수요 예측 가능성을 탐색했다. 
다른 분야에 비해 통계적, 데이터사이언스적 분석론 도입에 다소 소극적인 입법·법제분야에서 언론데이터, 의안정보 등 다양한 데이터를 비정형 텍스트 빅데이터 분석 기술을 활용하여 입법수요를 예측해보는 모형 개발은 법학과 타 학제 간 융합연구의 틀을 마련하는 동시에 지방활성화, 재정수반, 인구감소 등 각종 국정현안에서 입법·법제적 대응 마련에 기여할 것으로 기대한다.