クラスタリングによる利用者投稿動画の偏在性分析
抄録
動画や小説,画像などのコンテンツを投稿するサービス(CGM, Consumer Generated Media) が人気である。近年CGM サイトへの投稿コンテンツの画一化への懸念がある。多様性が減少し画一化が進むと文化的な活力も減り,サイト経営にも問題になる。我々はニコニコ動画を対象に,動画の多様性動向について分析している。今回,動画のメタデータにクラスタリングを適用し,クラスタのサイズ等から動画集合の多様性について分析した。動画をクラスタリングするには,動画をベクトルで表現する必要がある。動画にはタイトル,説明文,視聴者が付与するタグが付随しているものの,これらの文字は重要情報ではあるものの,情報量が少なくまた単語のゆらぎも大きい。そこで,辞書であるニコニコ大百科等を利用して,動画ベクトル化する。ニコニコ大百科の説明ページから,Doc2Vec で見出し語を,Word2Vec で各単語をベクトル化した。単語のベクトルデータを用いて,各動画をベクトルで表現した。次に動画ベクトルの集合を分割X-means でクラスラリングした。その後,各クラスタのサイズなどを分析することで,投稿動画の多様性を分析した,ベクトル化,クラスタリングの結果,および多様性動向の分析結果について報告する。
1.はじめに / 2.ニコニコ動画とニコニコデータセット / 3.ニコニコ大百科を用いた動画ベクトル化 / 4.ベクトル化とクラスタ数決定指標の組み合わせの最適化 / 5.クラスタリングによる偏在性分析 / 6.おわりに
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1050580007681881728
-
- NII論文ID
- 120006654879
-
- HANDLE
- 2324/1912138
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB
- CiNii Articles
- KAKEN