大規模webデータストリームに対する流行の拡散パターンの抽出手法

書誌事項

タイトル別名
  • Extraction Method of Interest Diffusion for Web Data Streams

この論文をさがす

抄録

本論文では,webの検索データストリームに対する新しい特徴抽出手法であるFluxCastを提案する.提案手法は,(keyword, location, time)の3つの属性から構成される3階テンソルストリームに対し,時間変化するトレンドや季節性パターン,そして地域間の関心の拡散のパターンを継続的に抽出する.具体的には,(a)検索数のトレンドや地域間の関心の拡散のパターンを解釈可能か形で抽出し,(b)逐次的なモデルの更新によりそれらのパターンの動的な変化に適応する.また,(c)手動のパラメータに依存せず全自動で特徴を抽出する.GoogleTrendsより取得した実際の検索数のデータを用いた実験では,提案手法が地域間の流行の拡散を効果的に抽出することができていることを示す.また,既存手法と比較して,少ない計算時間で高い予測精度を達成できることを明らかにする.

In this paper, we propose a new feature extraction method FluxCast for web search data streams. The proposed method continuously extracts time-varying trends, seasonal patterns, and patterns of interest diffusion among regions from a third-order tensor stream consisting of the three attributes (keyword, location, time). Specifically, FluxCast can capture (a) key trends and patterns of interest diffusion among regions by reaction-diffusion equations, and (b) the model is adapted to dynamic changes in these patterns by incrementally updating the model. Finally, it is a (c) fully automatic method without relying on manual parameters. Experiments using web search volume data obtained from GoogleTrends show that the proposed method is effective in extracting the pattern of interest diffusion among regions. We also show that the proposed method can achieve higher prediction accuracy in less computation time than existing methods.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ