特徴抽出方法の改善によるベイジアンフィルタの精度向上

書誌事項

タイトル別名
  • トクチョウ チュウシュツ ホウホウ ノ カイゼン ニ ヨル ベイジアンフィルタ ノ セイド コウジョウ
  • Improvement of Feature Extraction for Bayesian Spam Filtering

この論文をさがす

抄録

本稿では,従来法の1つであるベイジアンフィルタを用いたspamメールフィルタの精度(true negative rate)を改善する方法について提案する.これまでの学習型spamメールフィルタとしては,ベイジアンフィルタがよく利用されており,一定の成果が得られている.しかしながら,ベイジアンフィルタを利用した方法においても,誤検出率(false positive rate)の低減や,さらなる精度向上が期待される.我々は,単語のspam確率(尤度)の分布およびメールのspam度の分布状況を分析し,誤検出をおさえながらも,高い判定精度を実現する方法について提案し,その精度について,従来方式と比較して評価する.

We propose an improved baysian filter for spam mail detection. Bayesian filter was used on existing learning spam filters which achieved some positive results. Although we expect them to improve the true negative rate while keeping the false positive rate low. Therefore, it was based on a thorough review of distribution for each word and mail that our means of spam mail detection showed an impressively higher accuracy than ever.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ