弱分類器の調整に基づく不均衡データ向けアンサンブル・フレームワーク

植原, リサ, 駒水, 孝裕, 小川, 泰弘, 外山, 勝彦

分類器を構築する上で，ラベルの不均衡性は分類性能を低下させる要因の一つとなっている．多くの分類器は，データに偏りがある場合，多数派のラベルを出力しやすい傾向にある．しかし，世の中の多くのデータは少数派の方が重要である場合が多い．そのため，不均衡データにおいて，多数派と少数派を共に精度良く分類する必要がある．この問題に有効な手法の一つとしてアンダーサンプリングがある．アンダーサンプリングでは，多数派のデータを少数派の数に合わせてサンプリングする．単純なアンダーサンプリングでは，学習に使われない多数派のデータが多く存在する．これに対して，アンダーサンプリングを複数回適用し，それぞれについて弱分類器を学習し，アンサンブルする手法が提案されている．この手法では，多数派の数と少数派の数の比率を一定にして，複数回のサンプリングを行っている．本稿では，様々な比率を用いることによる利点を活用するために，複数の異なる比率によるアンダーサンプリングを組み合わせて，分類を行うことを考える．さらに，異なる比率を用いた弱分類器の性質は異なるため，学習する弱分類器の数を比率に応じて調整する．実験によって，既存手法と比較し，複数の比率を取り入れたことによる有効性を示す．また，弱分類器の数を固定した場合と比較し，それを変化させたことによる有効性を示す．

弱分類器の調整に基づく不均衡データ向けアンサンブル・フレームワーク

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

弱分類器の調整に基づく不均衡データ向けアンサンブル・フレームワーク

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について