機械学習によるメールヘッダ情報に基づく迷惑メールフィルタリング
書誌事項
- タイトル別名
-
- A Novel Email Filtering Method Based on the Information in Email Header with the Use of a Machine Learning Technique
説明
迷惑メールのフィルタリングには,さまざまな手法とアプリケーションソフトが開発されている.我々は機械学習システムを用いてメールヘッダ情報から特徴を抽出してフィルタリングに利用する新たな手法を開発した.これまでに,メールに含まれる単語の出現頻度とその語順を組み合わせた情報を,機械学習システムで解析し,メールの特徴を決定木で表現して利用する手法を確立した.同様の手法を用いて,メールヘッダ情報からフィルタリングに必要な特徴を抽出して評価したところ,正規メールのヘッダに着目した特徴解析によって高い精度で迷惑メールの分類を行えることが明らかになった.
A lots of methods and application software had been developed for spammail ltering. We have developed a new ltering system to classify spam andnon-spam mails by the use of a rule extracted from email headers by a machinelearning system. Previously, we had established a classi cation method basedon the appearance order and the frequency of a word. This rule was representedby a decision tree producted from the machine learning system. In this study,we evaluated the rule extracted from email headers by the same classi cationmethod, with which could classify emails with a high accuracy rate by focusingon non-spam mail headers.
収録刊行物
-
- マルチメディア通信と分散処理ワークショップ2010論文集
-
マルチメディア通信と分散処理ワークショップ2010論文集 2010 (11), 158-163, 2010-10-20
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050855522090970240
-
- NII論文ID
- 170000075123
-
- Web Site
- http://id.nii.ac.jp/1001/00090013/
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB
- CiNii Articles