ホテルの評価値予測のためのカテゴリ特化型感情極性辞書

Bibliographic Information

Other Title
  • Category-oriented Japanese Sentiment Polarity Dictionary for Rating Prediction of Hotels

Search this article

Description

ホテル予約サイトでは,ホテルの宿泊客から投稿された各ホテルに対する評価が提供される.各評価には,自然言語テキストによるレビューと,「サービス」や「立地」,「部屋」などの複数のカテゴリのそれぞれに対する数値による評価値が含まれる.しかし評価の中には,一部の評価値がレビューの内容と矛盾しているものが存在する.そのような評価は,サイト利用者を混乱させる可能性がある.このような問題を解決するために,レビューの文章から各カテゴリに対する評価値を予測する手法を提案する.本提案手法では,楽天トラベルのレビューデータベースを利用して,カテゴリ特化型感情極性辞書を構築し,それを元に評価値を予測する.カテゴリ特化型感情極性辞書は,「悪い」,「軽い」,「美味しい」などの各感情語について,カテゴリごとに感情極性値(ポジティブまたはネガティブの度合い)を与える.我々の実験では,BERTを用いて各レビューをベクトル化したレビューベクトルとカテゴリ特化型感情極性値を組み合わせることで,BERTを単体で用いる場合や既存辞書の感情極性値を組み合わせる場合よりも高い精度で評価値予測を行うことができた.さらに,カテゴリを細分化したサブカテゴリに対しても,カテゴリ特化型感情極性値とBERTとを組み合わせることの有用性を示した.

Hotel booking sites provide us hotel evaluations, each of which includes a textual review and numeric ratings for multiple categories such as “Service”, “Location”, “Rooms”, etc., submitted by a hotel guest. However, textual reviews and numeric ratings of some evaluations are inconsistent. For example, a textual review which praises the hotel is submitted with low ratings. Such evaluations may confuse site users. To resolve such problems, we propose a high accuracy method to predict a numeric rating for each category from a textual review. Our new idea is to use Category-oriented Sentiment Polarity Dictionaries (CSPD), each of which is automatically compiled for each category using a Rakuten Travel review database in advance. The CSPD gives the sentiment polarity value (i.e., the positivity/negativity value) for each sentiment word such as “bad”, “light”, and “delicious” for each category. In our experiments, we combine the sentiment polarity value by CSPD and word vectors derived by BERT to obtain an expected rating value from a textual review. Our experimental results show that the combined method with CSPD attains higher accuracy than the case using only BERT vectors and the case using existing dictionaries. Additionally, when we apply CSPD and BERT to sub-categories obtained by segmenting each category further, our method is effective against the rating prediction from reviews.

Journal

Details 詳細情報について

Report a problem

Back to top