HTMLタグの木構造に着目したWebページのクラスタリング手法

  • 折原 大
    電気通信大学大学院 電気通信学研究科 システム工学専攻
  • 内海 彰
    電気通信大学 電気通信学部 システム工学科

書誌事項

タイトル別名
  • HTML タグ ノ キコウゾウ ニ チャクモク シタ Web ページ ノ クラスタリング シュホウ

この論文をさがす

抄録

<p>本研究では,従来の内容に基づくクラスタリング手法とは異なり,ページのスタイルに基づくWebページのクラスタリング手法を提案する.提案する手法では,Webページに特有のHTMLタグ情報に着目し,HTMLタグの木構造の情報に基づいたクラスタリングを行う.</p>

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ