クラスタリングによる利用者投稿動画の偏在性分析

HANDLE Open Access
  • Sakata, Yuki
    Department of Electrical Engineering and Computer Science, School of Engineering, Kyushu University
  • Ito, Eisuke
    Research Institute for Information Technology, Kyushu University : Associate Professor

Abstract

動画や小説,画像などのコンテンツを投稿するサービス(CGM, Consumer Generated Media) が人気である。近年CGM サイトへの投稿コンテンツの画一化への懸念がある。多様性が減少し画一化が進むと文化的な活力も減り,サイト経営にも問題になる。我々はニコニコ動画を対象に,動画の多様性動向について分析している。今回,動画のメタデータにクラスタリングを適用し,クラスタのサイズ等から動画集合の多様性について分析した。動画をクラスタリングするには,動画をベクトルで表現する必要がある。動画にはタイトル,説明文,視聴者が付与するタグが付随しているものの,これらの文字は重要情報ではあるものの,情報量が少なくまた単語のゆらぎも大きい。そこで,辞書であるニコニコ大百科等を利用して,動画ベクトル化する。ニコニコ大百科の説明ページから,Doc2Vec で見出し語を,Word2Vec で各単語をベクトル化した。単語のベクトルデータを用いて,各動画をベクトルで表現した。次に動画ベクトルの集合を分割X-means でクラスラリングした。その後,各クラスタのサイズなどを分析することで,投稿動画の多様性を分析した,ベクトル化,クラスタリングの結果,および多様性動向の分析結果について報告する。

1.はじめに / 2.ニコニコ動画とニコニコデータセット / 3.ニコニコ大百科を用いた動画ベクトル化 / 4.ベクトル化とクラスタ数決定指標の組み合わせの最適化 / 5.クラスタリングによる偏在性分析 / 6.おわりに

Related Projects

See more

Keywords

Details 詳細情報について

  • CRID
    1050580007681881728
  • NII Article ID
    120006654879
  • HANDLE
    2324/1912138
  • Text Lang
    ja
  • Article Type
    conference paper
  • Data Source
    • IRDB
    • CiNii Articles
    • KAKEN

Report a problem

Back to top