自己組織化マップと検索エンジンを用いたWeb文書の分類ビュー機構

書誌事項

タイトル別名
  • ジコ ソシキカ マップ ト ケンサク エンジン オ モチイタ Web ブンショ ノ ブンルイ ビュー キコウ
  • A Classification View Mechanism for Web Documents based on Self-Organizing Maps and Search Engines

この論文をさがす

抄録

本論文では Kohonenの自己組織化マップ(Self-Organizing Map)と既存の検索エンジンを用いた Web文書分類ビュー機構について述べる. 提案する分類ビュー機構は 検索エンジンを用いて収集したWeb文書をユーザの視点や目的に応じて効果的に自動分類することを目的としている. 現在 Web文書に対する検索手段として様々な検索エンジンが提供されている. これらの検索エンジンの検索結果は通常膨大な量であり 検索された文書を一つ一つ閲覧していくことはユーザにとって大変な労力となる. よって こういったシステムを補完する目的で 収集されたWeb文書をユーザの視点や目的に応じて自動分類する機能が必要である. また Web文書の中には 一つの話題をリンクでつながったいくつかのWeb文書で表現している場合があり そういった文書群は現在の検索エンジンの検索結果には現れない場合が多い. 本論文では (1)収集したWeb文書を自己組織化マップを用いて動的に分類し (2)得られた分類マップに対してユーザの視点を反映するための操作を対話的に施すことで 分類マップを段階的に修正できる機構を開発した. さらに 収集したWeb文書の分類を行う上で基本となる情報単位を個々のWeb文書とするのみならず 関連あるWeb文書群を単位とした分類を行うための方式を提案している. 本研究におけるユーザビューとは ユーザのWeb文書の分類意図や検索目的をシステムに対して反映させる機構を意味している.

In this paper, we propose an effective classification view mechanism for hypertext data such as web documents based on Kohonen's Self-Organizing Map (SOM) and search engines. Web documents collected by search engines are automatically calssified by SOM and the obtained SOMs are incrementally modified according to the user's point of view and their purposes. At present, various search engines are provided to retrieve web documents. When we use search engines to retrieve web documents, we get many answers as ever before, so we have a lot of labor to examine each web document. Therefore, in order to make up for search engines, we need a function to classify web document corresponding to the user's point of view and their purposes. Furthermore, we cannot retrieve pertinent web documents by conventional search engines, when a specific topic is often described by more than one web document. To solve these problems, we exploited a content-based clustering system for web documents. In this system, web documents are automatically clustered by their feature vectors produced from web documents or minimal subgraphs consisting of multiple web documents, and their overview maps are dynamically generated by SOM. Furthermore, we propose a method by which an obtained SOM is modified by user's interaction such as feedback operations. It is important how to reflect the aim of classification and the purpose of retrieval to this system. In our research, we intend to solve these problems by providing a view mechanism in which a basic unit of web document are determined by users and relevance feedback operations enables the generation of an overview map which reflects user needs.

収録刊行物

被引用文献 (7)*注記

もっと見る

参考文献 (24)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ