書誌事項
- タイトル別名
-
- WWW ガゾウ ケンサク システム ニ オケル ユウガイ ガゾウ フィルタリング シュホウ
- A Method of Filtering Hazardous Images on WWW Image Search Systems
この論文をさがす
説明
WWW画像検索システムは検索キーに対する画像をWWW空間から手軽に取得できるため,教育現場における資料収集ツールとして頻繁に利用されているが,一般的なキーに対する検索結果内に有害な画像が含まれるといった問題点がある.この問題点に対して,有害画像を含むページのURLをデータベース化し,検索結果の各URLをチェックすることで有害画像をフィルタリングするシステムが存在する.しかし,フィルタリング精度を高めるために, 大規模なURLデータベースの構築,更新作業に多大な労力が必要になる.そこで本論文では,ユーザ・サイドで構築したURLデータベースを用いて,既存のWWW画像検索システムの検索結果から有害画像をフィルタリングする手法を提案する.本手法は有害画像を象徴する単語群をユーザ・サイドで用意するだけで検索サーバごとにURLデータベースを自動構築する.そして,自動構築したURLデータベースにはURLのパスごとに有害度の重みづけを行い,有害性の高いURLを部分的に識別することで高精度なフィルタリングを実現する.さらに,URLデータベース自動構築の際に用意する各単語の意味的多義性に着目し,ノイズ混入の可能性がある単語をあらかじめ自動選別することでフィルタリング精度を高める.既存システムとしてGoogle Image Searchを用い,有害な画像が検索される可能性のある27個の検索キーに対する評価実験を行った結果,F尺度として約70%のフィルタリング精度が得られた.
WWW image retrieval systems are extremely useful for collecting educational materials from the WWW space. The search results, however, often include sexually explicit or pornographic contents, which are not suitable for educational purposes. Some filtering systems use simple URL databases to filter out hazardous images, but these are not always effective, since it is very hard to maintain constantly changing URL databases. In this paper, we propose a new filtering method using partial URL-based weighing scheme. The method first gathers a lot of hazardous URLs from search results of conventional WWW image retrieval systems by hazardous keywords. The method next decomposes a full URL into several partial paths, then estimates hazardous score for each partial path based on frequencies of paths. And it filters out hazardous images by distinguishing partial URL that there is possibility of hazardous. In addition, we focus on the ambiguity of hazardous keywords, and the method to select only suitable hazardous keywords is also proposed. Experimental results show that the proposed method can improve the accuracy of filtering out hazardous images from search results of conventional systems.
収録刊行物
-
- 情報処理学会論文誌データベース(TOD)
-
情報処理学会論文誌データベース(TOD) 47 (SIG8(TOD30)), 147-156, 2006-06-15
東京 : 情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050282812868568960
-
- NII論文ID
- 110006390945
-
- NII書誌ID
- AA11464847
-
- ISSN
- 18827799
- 03875806
-
- NDL書誌ID
- 8011148
-
- 本文言語コード
- ja
-
- 資料種別
- article
-
- データソース種別
-
- IRDB
- NDLサーチ
- CiNii Articles
- KAKEN