クラスタリングによる利用者投稿動画の偏在性分析
-
- Sakata, Yuki
- Department of Electrical Engineering and Computer Science, School of Engineering, Kyushu University
-
- Ito, Eisuke
- Research Institute for Information Technology, Kyushu University : Associate Professor
Abstract
動画や小説,画像などのコンテンツを投稿するサービス(CGM, Consumer Generated Media) が人気である。近年CGM サイトへの投稿コンテンツの画一化への懸念がある。多様性が減少し画一化が進むと文化的な活力も減り,サイト経営にも問題になる。我々はニコニコ動画を対象に,動画の多様性動向について分析している。今回,動画のメタデータにクラスタリングを適用し,クラスタのサイズ等から動画集合の多様性について分析した。動画をクラスタリングするには,動画をベクトルで表現する必要がある。動画にはタイトル,説明文,視聴者が付与するタグが付随しているものの,これらの文字は重要情報ではあるものの,情報量が少なくまた単語のゆらぎも大きい。そこで,辞書であるニコニコ大百科等を利用して,動画ベクトル化する。ニコニコ大百科の説明ページから,Doc2Vec で見出し語を,Word2Vec で各単語をベクトル化した。単語のベクトルデータを用いて,各動画をベクトルで表現した。次に動画ベクトルの集合を分割X-means でクラスラリングした。その後,各クラスタのサイズなどを分析することで,投稿動画の多様性を分析した,ベクトル化,クラスタリングの結果,および多様性動向の分析結果について報告する。
1.はじめに / 2.ニコニコ動画とニコニコデータセット / 3.ニコニコ大百科を用いた動画ベクトル化 / 4.ベクトル化とクラスタ数決定指標の組み合わせの最適化 / 5.クラスタリングによる偏在性分析 / 6.おわりに
- Tweet
Details 詳細情報について
-
- CRID
- 1050580007681881728
-
- NII Article ID
- 120006654879
-
- HANDLE
- 2324/1912138
-
- Text Lang
- ja
-
- Article Type
- conference paper
-
- Data Source
-
- IRDB
- CiNii Articles
- KAKEN