文書クラスタリングによるトピック抽出および課題発見

書誌事項

タイトル別名
  • TOPIC EXTRACTION AND SOCIAL PROBLEM DETECTION BASED ON DOCUMENT CLUSTERING
  • ブンショ クラスタリング ニ ヨル トピック チュウシュツ オヨビ カダイ ハッケン

この論文をさがす

抄録

自然言語処理技術を応用し,分析対象となる新聞記事を取得して,記事を自動的に分類し,トピックとなる社会事象を抽出,さらにはトピックを構造化して課題の発見に至る手続きを可能とする手法を開発した.この手法によれば,多数のトピックを含む文書集合に対して階層的クラスタリングを施し,クラスタ間の語彙使用の類似性に基づく構造化を行い,個々のクラスタについてこれを要約するキーワードおよび関係する主体(組織名)を自動抽出することによって内容を効率的かつ経済的に俯瞰できることを示した.本論文では,産業活動に伴う事故・災害に関する社会の課題発見を事例として,これらのテキストマイニング技術を統合した社会変化の定量的分析手法の有効性について検証した.

収録刊行物

被引用文献 (5)*注記

もっと見る

参考文献 (5)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ