BERTモデルを用いたSDGsに関するマルチラベル文書分類器の構築とマッチングシステムの開発

DOI

書誌事項

タイトル別名
  • A Development of Multi-label Text Classification and Matching System for Achieving SDGs with BERT

抄録

<p>幅広いステークホルダーがSDGs(持続可能な開発目標)に取り組み,成功事例を共有することは重要である.そこで本研究は深層学習型の自然言語処理モデルBERTで,①活動事例や課題をSDGsに写像する分類器を構築すること,② SDGs間の連環関係 (nexus) を可視化すること,③地域課題とそれを解決しうる取り組み事例とのマッチングシステムを構築することを目的とした.まず,国連関連文書,日本の政府関連文書,内閣府が収集するSDGsの課題解決等に関する提案文書を収集し,各文書とそれに対応する複数のSDGsが対になったマルチラベルデータフレームを構築し,WordNetを用いたデータオーグメンテーションを行った.次に,訓練済み日本語BERTモデルをマルチラベルテキスト分類タスクでファインチューニングし,nested cross-validationでハイパーパラメータの最適化と交差検証精度の推定を行った.最後に,学習後のBERTモデルでSDGs間の共起ネットワークを可視化するとともに,地域課題と取り組み事例のベクトル埋め込みを行ってコサイン類似度を取得することで,マッチングシステムの開発を行った.</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390569845479726976
  • NII論文ID
    130008051874
  • DOI
    10.11517/pjsai.jsai2021.0_4h3gs11d01
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ