識別問題におけるMDL基準を用いたクラスタリング法

書誌事項

タイトル別名
  • A Clustering Method in Classification Problems Using the MDL criterion

この論文をさがす

抄録

パターン認識において, サンプルの分布に正規分布などの単純なパラメトリックモテルを仮定できない場合, k最近隣法や区分的線形識別規則などのノンパラメトリックな識別規則が有効である。これらの識別規則では, 訓練サンプル集合に対する過学習を回避するためや計算コストの削減のために, 訓練サンプル集合上の各クラスターの重心である代表点を訓練サンプル集合の代用とすることが多い。ほとんどの応用例では, このクラスター数を主観による評価で発見的に決定し, 識別問題に利用している。しかし, それでは必ずしも最適な識別性能を発揮できているとは限らず, 客観的な評価基準によるクラスター数の推定法が必要となっている。この問題に対し, 文献[1]では, サンプルの分布に混合正規分布モテルを仮定し, その特徴ベクトルの発生確率に関する尤度と, 分布を記述するパラメータ数のトレードオフをMDL基準により評価し, 最適なクラスター数の推定を試みている。しかし, この方法は教師なし学習であるため, これを識別問題に適用する場合には各クラス毎に尤度を単独で評価する必要があり, 必ずしも識別に最適なクラスター数は求められない。 そこで本研究では, 混合正規分布モテルにおいて, 文献[3]の「確率的規則の学習問題」の枠組に基づき, MDL基準を利用した, 識別を前提とした最適なクラスター数の推定を試みる。

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ