書誌事項
- タイトル別名
-
- Web ディレクトリ ノ カイソウ コウゾウ オ リヨウシタ ケンサク タイショウ ブンショ ノ ブンヤ スイテイ ニ モトズイタ ゲンゴ オウダン ジョウホウ ケンサク
- Cross-Language Information Retrieval by Estimation of Domain Using Web Directory Structure
この論文をさがす
抄録
本論文では,Web 文書の言語横断情報検索において,Web ディレクトリの階層構造を利用して問合せの検索対象分野の推定に基づいた検索手法を提案する.提案手法では,Yahoo! カテゴリのような複数の言語版を持つWeb ディレクトリを問合せ翻訳における訳語の曖昧性解消のための言語資源として利用し,Web ディレクトリの下層のカテゴリを上位のカテゴリに統合したうえで,利用者が入力した問合せ語群から検索対象分野の範囲を推定することで,問合せ語群の最適な訳語に翻訳することにより,言語横断情報検索を行う.評価実験では,Web 文書の言語横断情報検索に適切なカテゴリ統合度がどの程度であるのか検証し,提案した検索対象分野の推定の有効性を検証した.
In this paper, we propose a cross-language information retrieval (CLIR) method based on an estimate of query domain related with search results using hierarchic structures of Web directories. To get the most appropriate translation of the queries, we utilize the Web directories written in many different languages as multilingual corpus for disambiguating translation of the query and estimate a domain of search results using hierarchical structures of Web directories. Experimental evaluations showed that we could have an advantage in retrieval accuracy using our proposal for disambiguating translation in CLIR system.
収録刊行物
-
- 情報処理学会論文誌データベース(TOD)
-
情報処理学会論文誌データベース(TOD) 49 (SIG7(TOD37)), 59-71, 2008-03-15
東京 : 情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050845762821967488
-
- NII論文ID
- 110006684389
-
- NII書誌ID
- AA11464847
-
- ISSN
- 18827799
- 03875806
-
- NDL書誌ID
- 9421216
-
- 本文言語コード
- ja
-
- 資料種別
- article
-
- データソース種別
-
- IRDB
- NDL
- CiNii Articles