書誌事項
- タイトル別名
-
- The Extent of the Deep Web in Japanese Institutional Repositories
- シンソウ ウェブ ノ ジッタイ ト ソノ ヨウイン : キカン リポジトリ ニ トウロク サレタ ブンケン オ モチイタ チョウサ
この論文をさがす
説明
ウェブの規模が増大するにつれ,検索エンジンからアクセスできない状態,すなわち深層ウェブも増大していることへの関心が高まっている。マッカウンら(2006)とハーゲドーンとサンテッリ(2008)は,深層ウェブの規模をOAI-PMHを用いて収集した機関リポジトリに収録された文献のメタデータを用いて計測した。本研究では,2009年9月に,先行研究の手法を応用し,日本の機関リポジトリから収集した全文PDFファイルのURLを用いて,より大規模に深層ウェブの比率を計測した。その結果,Google, Yahoo!, Bingの3つの検索エンジンから検索できるウェブは72.0%に過ぎず,28.0%が深層ウェブとなっていることが分かった。1つの検索エンジンでは,最高でもGoogleの53.2%であった。また,PDFファイルとURLの特徴の調査から,動的なURLや長いURLが深層ウェブとなる要因であることが分かった。
収録刊行物
-
- 日本図書館情報学会誌
-
日本図書館情報学会誌 58 (2), 97-109, 2012
日本図書館情報学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390001204568588160
-
- NII論文ID
- 110009479379
-
- NII書誌ID
- AA11333306
-
- ISSN
- 24324027
- 13448668
-
- NDL書誌ID
- 023789682
-
- 本文言語コード
- ja
-
- 資料種別
- journal article
-
- データソース種別
-
- JaLC
- NDLサーチ
- CiNii Articles
- KAKEN
-
- 抄録ライセンスフラグ
- 使用不可