トピックと局面の対応関係に基づく実生活ツイートのマルチラベル分類

書誌事項

タイトル別名
  • Multi-label Classification for Real Life Tweets Based on Association between Topics and Aspects

この論文をさがす

説明

身近な出来事や関心事を投稿し共有するTwitter上には,食事や交通,災害,気象など,様々な生活の局面で有益なツイートが数多く投稿されている.本論文では,これらの有益なツイートに適切な局面を付与する,階層的推定法を用いたマルチラベリングを提案する.第1段階では,大量のツイートに対してLDAを用いてトピックを抽出し,第2段階では,ラベル付けされた少量のツイートを用いてトピックと局面の対応関係を構築する.構築した対応関係を用いて未知のツイートに局面ごとのスコアを算出し,閾値を超えたスコアを持つ局面を動的に付与する.収集した大量のツイートを用いた評価実験を行い,未知のツイートに対して適切な複数の局面を推定できることを明らかにした.

Recently, lots of users share their current events and opinions by using the Twitter. Hence, some of these tweets are beneficial in several aspects of user's real life, i.e., eating, traffic, disaster, weather, and so on. In this paper, we propose multi-label classification using hierarchical estimation method for estimating appropriate aspects. In the first phase, many topics are extracted from a sea of tweets using Latent Dicichlet Allocation (LDA). In the second phase, associations between many topics and fewer aspects are built using a small set of labeled tweets. Our sophistical evaluations demonstrate that the proposed method can estimate several appropriate aspects of each unknown tweets.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

  • CRID
    1050282812881221504
  • NII論文ID
    110009799909
  • NII書誌ID
    AA11464847
  • ISSN
    18827799
  • Web Site
    http://id.nii.ac.jp/1001/00101883/
  • 本文言語コード
    ja
  • 資料種別
    article
  • データソース種別
    • IRDB
    • CiNii Articles
    • KAKEN

問題の指摘

ページトップへ