政治資金収支報告書のOCRによる政治資金データベースへの試み

DOI

書誌事項

タイトル別名
  • Attempt to Create a Political Fund Database using OCR

抄録

<p>政治資金収支報告書は、政治団体によって提出され、政治資金規正法により公表が義務付けられています。しかし、これらの報告書は多くが手書き文字を含む紙媒体であり、機械判読に適さず、オープンデータの定義を満たしません。そのため、これらのデータをデータベース化することで透明性が向上し、市民による政治的な意思決定への参加が促進されると考えられます。本研究では、政治資金収支報告書の「(その2)収支の状況」に限定し、光学式文字認識(OCR)技術を用いてデータの抽出と整備を行いました。具体的には、2019年に提出された政治資金収支報告書に対し、収支の状況ページからデータを抽出し、データセットを構築しました。また、作成したデータセットを元に分析例を示しました。本研究は、政治資金データベースの作成に向けた第一歩であり、今後も政治資金報告書の形式やデータの改善に取り組むことが求められます。政治資金データベースの構築は、より透明で民主的な社会を実現するための重要な一歩であると考えられます。</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390296808221162496
  • DOI
    10.11517/pjsai.jsai2023.0_2h1os3a01
  • ISSN
    27587347
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ