Two-step Variable Screening Method for the Mahalanobis-Taguchi Method with Small Training Data

DOI HANDLE Web Site Web Site オープンアクセス
  • Yu, Hengjun
    九州大学大学院芸術工学研究院コミュニケーションデザイン科学部門
  • 井上, 光平
    九州大学大学院芸術工学研究院コミュニケーションデザイン科学部門
  • 原, 健二
    九州大学大学院芸術工学研究院コミュニケーションデザイン科学部門
  • 浦濱, 喜一
    九州大学大学院芸術工学研究院コミュニケーションデザイン科学部門

書誌事項

タイトル別名
  • A Robust K-Means for Document Clustering

この論文をさがす

抄録

We propose a robust K-means clustering algorithm for document clustering, where we suppose that a document-term matrix is given as an input dataset, and the documents in the dataset are clustered on the basis of the frequency of terms that occur in each document. We introduce a robust loss function to K-means clustering to obtain its robust version, and also propose a feature transform method for improving the performance of document clustering. Experimental results show that the proposed method improves the robustness of K-means to outliers and the performance of document clustering demonstrated on one of the BBC datasets originating from the BBC News.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ