k-meansのための初期値外れ値を考慮した初期値設定手法の提案

この論文をさがす

説明

KKZは観測されたデータの中で最も離れたデータ同士をk-meansの初期値とする方法である。最も離れたデータ同士を初期値とすることで、生成されるクラスタのクラスタ間分散が大きくなることを期待できる。しかし、KKZが初期値としての外れ値を選択した場合、生成されたクラスタのクラスタ内分散が大きくなってしまう。本報告ではこの問題を解決する方法を提案する。提案手法はMT法の考えを用いて、全データの平均からのマハラノビス距離が4か9を超えたデータを初期値から避けてKKZを行う。提案手法の有効性を検証するために、複数のデータに提案手法を適用し、従来の初期値選択手法との比較を行う。

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ