接尾辞木を用いた圧縮尺度計算による効率よいスパムポスト検出手法
書誌事項
- タイトル別名
-
- Efficient Spam Post Detection by Compression-based Measure Using Suffix Trees
この論文をさがす
説明
本稿では,ブログや掲示板を対象とした内容ベースの効率よいスパムポスト検出手法を提案する.本手法は,与えられた文書集合に対して接尾辞木を用いた確率モデル(確率接尾辞木)を構築し,この文書集合上の推定された出現確率を利用して検出を行う.実際のウェブ上の掲示板データを用いた計算機実験では,提案手法の有効性を示した.特に,現在の技術では検出が比較的困難なスパムであるワードサラダに対する有効性が示された.
収録刊行物
-
- 電子情報通信学会技術研究報告. DE, データ工学
-
電子情報通信学会技術研究報告. DE, データ工学 108 (211), 15-16, 2008-09-14
一般社団法人電子情報通信学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1573668927312574720
-
- NII論文ID
- 110007100392
-
- NII書誌ID
- AN10012921
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles