評点付きレビュー文書を対象としたトピックモデルの構築に関する検討

書誌事項

タイトル別名
  • A Study on Construction of Topic Model Intended for Review Texts with Rating

この論文をさがす

説明

多くの企業にとって,商品(アイテム)に対するユーザレビューの解析は,商品開発やマーケティングの面で重要な役割を占めている.ユーザが自由に感想を記述することのできるレビューには,商品の長所や魅力だけでなく,不満や改善点などの声が豊富に含まれている.それらは商品開発における重要な情報源であり,大量のレビューに対し,自動で解析を行うことができれば,従来見逃していた有益な知見を得られるようになると期待できる.推薦システムにおいては,レビューに含まれる評点情報を利用し,ユーザやアイテムの関係性をとらえる協調フィルタリングが成果をあげている.一方,一般的なテキストの解析においては,潜在的なトピックを推定する手法である,トピックモデルが注目されている.本論文では,これらを発展させ,評点付きのレビューテキストに特化したトピックモデルを構築する.そこでまず,レビューテキスト中の単語の出現に対して,ユーザ・アイテムのトピックを仮定したトピックモデルSBi-LDA(Switching Bi-LDA)を提案する.続いて,ユーザ・アイテムのトピックに加え,評点情報も組み込んだ新たなトピックモデルMBi-LDA(Multi Bi-LDA)を構築し,提案する.実際のレビューテキストを用いた実験を行い,提案するモデルが従来のモデルに比べてパープレキシティの面で優れていることを示す.

In a lot of companies, analysis of users' reviews on items plays an important roll in the aspect of product development and marketing. Reviews are described by users freely so that they contain many opinions which are not only advantages of items but also disadvantages and improvements. They are important source of information. If huge number of reviews can be analyzed automatically, it is expected to obtain useful knowledge which is missed conventionally. In recommender systems, the collaborative filtering which can capture relationships among users and items using ratings of reviews achieves good results. In text analyses, topic models which can infer latent topics in texts are focused. This study develops these methods and constructs new topic models which are specific to review texts with rating. First, a topic model called SBi-LDA (Switching Bi-LDA) which assumes user-topics and item-topics on appearance of words is proposed. Then, a new topic model called MBi-LDA (Multi Bi-LDA) which incorporates ratings of reviews in addition to above topics is constructed and proposed. Experiments using real-life reviews are carried out and it is shown that the proposed models are superior to conventional models in terms of perplexity.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ