弱分類器の調整に基づく不均衡データ向けアンサンブル・フレームワーク

抄録

分類器を構築する上で,ラベルの不均衡性は分類性能を低下させる要因の一つとなっている.多くの分類器は,データに偏りがある場合,多数派のラベルを出力しやすい傾向にある.しかし,世の中の多くのデータは少数派の方が重要である場合が多い.そのため,不均衡データにおいて,多数派と少数派を共に精度良く分類する必要がある.この問題に有効な手法の一つとしてアンダーサンプリングがある.アンダーサンプリングでは,多数派のデータを少数派の数に合わせてサンプリングする.単純なアンダーサンプリングでは,学習に使われない多数派のデータが多く存在する.これに対して,アンダーサンプリングを複数回適用し,それぞれについて弱分類器を学習し,アンサンブルする手法が提案されている.この手法では,多数派の数と少数派の数の比率を一定にして,複数回のサンプリングを行っている.本稿では,様々な比率を用いることによる利点を活用するために,複数の異なる比率によるアンダーサンプリングを組み合わせて,分類を行うことを考える.さらに,異なる比率を用いた弱分類器の性質は異なるため,学習する弱分類器の数を比率に応じて調整する.実験によって,既存手法と比較し,複数の比率を取り入れたことによる有効性を示す.また,弱分類器の数を固定した場合と比較し,それを変化させたことによる有効性を示す.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1050574047122951424
  • NII論文ID
    170000150682
  • Web Site
    http://id.nii.ac.jp/1001/00198976/
  • 本文言語コード
    ja
  • 資料種別
    conference paper
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ