書誌事項
- タイトル別名
-
- New indices for Japanese text : The principle of making index and searching index
この論文をさがす
抄録
近年,実用化が進んでいる大規模な全文検索システムにおいては,単純な文字列枚索では高速化に限界があるため,文字成分表などのシグニチャファイル方式,あるいはn-gramによる転置ファイル方式などの高速化手法が提案されている.更に高速化を図るためには,n-gramではなく,検索文字列として意味のある通常の単語による転置ファイルを用いることが考えられるが,膠着語である日本語文書に対してその手法を適用しようとすると,形態素解析などの単語切り出しを行なわねばならず,その単語切り出しが完全に行なわれない限り,検索もれが避けられない.筆者らは,上の問題を解決する,検索もれのない単語索引検索方式を考案した.本方式では,単語による索引ファイルを構成するため,n-gramによる転置ファイルに比べて,原理的に高速化が可能であり,更に索引ファイルの容量も低減できる.本稿では,その単語索引作成方法と索引検索方法の原理について報告する.
収録刊行物
-
- 全国大会講演論文集
-
全国大会講演論文集 第50回 (ソフトウェア), 41-42, 1995-03-15
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1050574047111353856
-
- NII論文ID
- 110002876061
-
- NII書誌ID
- AN00349328
-
- Web Site
- http://id.nii.ac.jp/1001/00127849/
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB
- CiNii Articles