叫喚ツイート抽出手法の拡張

書誌事項

タイトル別名
  • On a Method for Extracting More Shouting Tweets from Twitter

この論文をさがす

抄録

マイクロブログの1つであるTwitterでは,突発的な感情の発露を表すために,「日本が勝ったぁああ」や「それはやめて~~ーー」のような叫喚表現化したツイートを用いることがある.これまでの先行研究では,こういった叫喚ツイートの叫喚表現化された部分を検出し,元の表現(「勝った」や「やめて」)に変換することで,既存の様々な辞書を利用できるようにするための手法やツイートから叫喚ツイートを抽出し,投稿者の感情の大きな変化を検知するという手法が提案されている.しかしながら,抽出される叫喚ツイートの種類についてはあまり深く検討されておらず,比較的単純な正規表現により検索可能な叫喚ツイートのみが抽出されていた.そこで本論文では,先行研究で提案された正規表現を拡張し,より多くの叫喚表現に対応できるようにするともに,提案手法による叫喚ツイートの抽出割合や抽出精度を評価することで,その有効性を検証する.

On Twitter, one of microblog services, shouting tweets like “Our national soccer team wooooon!” and “Stoooop it!!!” are often used in order to express a sudden emotional effusion. In some previous studies, methods for identifying word lengthening in tweets and transforming them into their original expressions have been proposed so that a variety of existing lexicons and dictionaries can be available. In other previous studies, methods for extracting shouting tweets from Twitter and detecting a huge change of emotions of the users who posted the tweets have been proposed. In these studies, however, what kinds of word lengthening should be detected is not considered very deeply. They have used comparatively simple regular expressions to extract shouting tweets from Twitter. This paper, therefore, proposes six regular expressions to extract more shouting tweets from Twitter, and shows effectiveness of the regular expressions by calculating extraction ratio of shouting tweets and accuracy on extraction of the shouting tweets.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

  • CRID
    1050282812886476160
  • NII論文ID
    170000150008
  • NII書誌ID
    AA11464847
  • ISSN
    18827799
  • Web Site
    http://id.nii.ac.jp/1001/00193696/
  • 本文言語コード
    ja
  • 資料種別
    article
  • データソース種別
    • IRDB
    • CiNii Articles
    • KAKEN

問題の指摘

ページトップへ