マイクロブログを対象とした著者推定手法の提案-10,000人レベルでの著者推定-

  • 奥野峻弥
    早稲田大学大学院基幹理工学研究科
  • 浅井洋樹
    早稲田大学大学院基幹理工学研究科早稲田大学グローバルエデュケーションセンター
  • 山名早人
    早稲田大学理工学術院|国立情報学研究所

この論文をさがす

抄録

従来,著者推定研究は小説に対する著者推定を中心に研究が行われており,推定対象を限定した,少人数に対する著者候補者群が取り扱われてきた.これに対し,我々はマイクロブログを対象にした,不特定多数の候補者群に対する著者推定の提案を行った.その際,精度向上のためマイクロブログ特有の叫喚フレーズに対する正規化手法,および計算量削減のため推定に必要となるメッセージ数を削減する手法を提案してきた.本稿では,より多くのマイクロブログ利用者を対象にした著者推定を行う上での問題点,特に学習用データとテストデータの取得期間の差異が精度に与える影響について検証し,学習用データの取得期間が精度に与える影響を小さくする手法を提案する.実験では Twitter ユーザ 10,000 人に対して著者推定を行い,Precision@1 で 0.535,MRR で 0.602 を達成した.

収録刊行物

キーワード

詳細情報 詳細情報について

  • CRID
    1570572702897458304
  • NII論文ID
    110009808968
  • NII書誌ID
    AN10114171
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ