トピックと局面の対応関係に基づく実生活ツイートのマルチラベル分類

Bibliographic Information

Other Title
  • Multi-label Classification for Real Life Tweets Based on Association between Topics and Aspects

Search this article

Description

身近な出来事や関心事を投稿し共有するTwitter上には,食事や交通,災害,気象など,様々な生活の局面で有益なツイートが数多く投稿されている.本論文では,これらの有益なツイートに適切な局面を付与する,階層的推定法を用いたマルチラベリングを提案する.第1段階では,大量のツイートに対してLDAを用いてトピックを抽出し,第2段階では,ラベル付けされた少量のツイートを用いてトピックと局面の対応関係を構築する.構築した対応関係を用いて未知のツイートに局面ごとのスコアを算出し,閾値を超えたスコアを持つ局面を動的に付与する.収集した大量のツイートを用いた評価実験を行い,未知のツイートに対して適切な複数の局面を推定できることを明らかにした.

Recently, lots of users share their current events and opinions by using the Twitter. Hence, some of these tweets are beneficial in several aspects of user's real life, i.e., eating, traffic, disaster, weather, and so on. In this paper, we propose multi-label classification using hierarchical estimation method for estimating appropriate aspects. In the first phase, many topics are extracted from a sea of tweets using Latent Dicichlet Allocation (LDA). In the second phase, associations between many topics and fewer aspects are built using a small set of labeled tweets. Our sophistical evaluations demonstrate that the proposed method can estimate several appropriate aspects of each unknown tweets.

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top