マイクロブログを対象とした著者推定手法の提案-10,000人レベルでの著者推定-
この論文をさがす
抄録
従来,著者推定研究は小説に対する著者推定を中心に研究が行われており,推定対象を限定した,少人数に対する著者候補者群が取り扱われてきた.これに対し,我々はマイクロブログを対象にした,不特定多数の候補者群に対する著者推定の提案を行った.その際,精度向上のためマイクロブログ特有の叫喚フレーズに対する正規化手法,および計算量削減のため推定に必要となるメッセージ数を削減する手法を提案してきた.本稿では,より多くのマイクロブログ利用者を対象にした著者推定を行う上での問題点,特に学習用データとテストデータの取得期間の差異が精度に与える影響について検証し,学習用データの取得期間が精度に与える影響を小さくする手法を提案する.実験では Twitter ユーザ 10,000 人に対して著者推定を行い,Precision@1 で 0.535,MRR で 0.602 を達成した.
収録刊行物
-
- 情報処理学会研究報告. 情報学基礎研究会報告
-
情報処理学会研究報告. 情報学基礎研究会報告 2014 (12), 1-6, 2014-07-25
一般社団法人情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1570572702897458304
-
- NII論文ID
- 110009808968
-
- NII書誌ID
- AN10114171
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles