同一ハッシュタグツイート群における時空間相関情報に基づく単語類似度の計量

書誌事項

タイトル別名
  • Extraction of Similar Words Based on Time-correlation and Co-occurrence Probability from Tweets of the Same Topic
  • ドウイツ ハッシュタグツイートグン ニ オケル ジクウカン ソウカン ジョウホウ ニ モトズク タンゴ ルイジド ノ ケイリョウ

この論文をさがす

抄録

Twitterにおける単語の表記ゆれを解消するために,ハッシュタグ内における出現単語の時間軸方向のふるまいの相関および共起確率に基づき類似単語の判定を行い,表記ゆれ対策辞書を構成する.提案手法では,ハッシュタグ内の各単語のふるまいの調査対象領域を分割限定することにより,辞書の構築時間の短縮を行う.提案手法の有効性を評価するため,2011年末のテレビ番組である紅白歌合戦のハッシュタグが付与されたデータを対象に,領域全体を用いる方法と提案分割法の比較を行う.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ