ベイジアンフィルタにおける画像スパムのフィルタリング方式の実現

書誌事項

タイトル別名
  • ベイジアンフィルタ ニ オケル ガゾウ スパム ノ フィルタリング ホウシキ ノ ジツゲン
  • A Bayesian-filter-based Image Spam Filtering Method
  • 侵入検出・検知

この論文をさがす

抄録

インターネットの普及とともに,迷惑メールの増加が近年問題となっている.2006年には,迷惑メールが電子メール全体の91%を占めたとの調査結果も存在する.迷惑メール対策として,ベイズ理論を用いて統計的にフィルタリングを行うベイジアンフィルタが広く利用されている.その特徴として,フィルタリングの精度が高く,迷惑メールの流行や個人の嗜好に合わせたフィルタリングが行えることがある.しかし,その回避策として,迷惑メールの内容を画像化して送信する画像スパムが急増している.ベイジアンフィルタはテキストデータに対して学習と判定を行うので,画像などのバイナリデータに対しては,適切な学習と判定ができない.そこで,本論文では,画像スパム対策として,ファイルサイズなどの添付画像の情報に着目し,これらの情報を既存のベイジアンフィルタのコーパス(学習データ)に加え,フィルタリングを行う方式を提案する.また,その評価結果を報告する.

In recent years, with the spread of the Internet, the increase in the number of spam has become one of the most serious problems. A recent report reveals that 91% of all e-mail exchanged in 2006 was spam. Using the Bayesian filter is a popular approach to distinguish between spam and legitimate e-mails. It applies the Bayes theory to identify spam. This filter proffers high filtering precision and is capable of detecting spam as per personal preferences. However, the number of image spam, which contains the spam message as an image, has been increasing rapidly. The Bayesian filter is not capable of distinguishing between image spam and legitimate e-mails since it learns from and examines only text data. Therefore, in this study, we propose an anti-image spam technique that uses image information such as file size. This technique can be easily implemented on the existing Bayesian filter. In addition, we report the results of the evaluations of this technique.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ