文意ベクトル間距離に基づくニュースヘッドラインに対する興味推定

説明

インターネット上には膨大な量のニュース情報が存在している.これによりユーザは多くの情報を入手できるというメリットが生まれる.しかし,ユーザは配信されている全てのニュースに興味を持っているわけではない.よって,ユーザがインターネット上のニュースを読むとき,興味のある情報を選別する必要がある.情報過多問題を解決するために,個人の興味を学習し,それを考慮した情報提供を行う個人向け情報配信システム PINOT を開発した.このシステムでは,ユーザの操作から興味を類推し,興味の学習を行う.しかし,記事文に多義語が含まれる場合,記事に対する興味の類推を誤る可能性がある.本稿では興味の類推を正確に行うために,記事文に対して,分布仮説に基づいて単語や文をベクトルで表現できる自然言語処理モデルを用いる.このベクトルには,文意といった特徴が表現されている.そして,類似性を表す尺度であるコサイン類似度を用いて,ユーザが興味ある記事に対して,ベクトル間が近い記事を,興味ある記事と類推し,推薦する.文意に着目することで,多義語が含まれた記事文に対する興味の類推を正確に行うことが期待できる.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ