接尾辞木を用いた圧縮尺度計算による効率よいスパムポスト検出手法

書誌事項

タイトル別名
  • Efficient Spam Post Detection by Compression-based Measure Using Suffix Trees

この論文をさがす

説明

本稿では,ブログや掲示板を対象とした内容ベースの効率よいスパムポスト検出手法を提案する.本手法は,与えられた文書集合に対して接尾辞木を用いた確率モデル(確率接尾辞木)を構築し,この文書集合上の推定された出現確率を利用して検出を行う.実際のウェブ上の掲示板データを用いた計算機実験では,提案手法の有効性を示した.特に,現在の技術では検出が比較的困難なスパムであるワードサラダに対する有効性が示された.

収録刊行物

参考文献 (7)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1573668927312574720
  • NII論文ID
    110007100392
  • NII書誌ID
    AN10012921
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ