書誌事項
- タイトル別名
-
- Full Text Approximate String Search using Suffix Arrays
この論文をさがす
説明
類似検索の手法としてDPマッチングアルゴリズムやトライを用いたError-tolerant Recognitionアルゴリズムが知られている. DPマッチングアルゴリズムは検索対象データの大きさに比例した計算時間がかかるのに対し, トライを用いたError-tolerant Recognitionアルゴリズムは検索対象データの大きさに依存せず高速に類似検索が行える. しかし, トライにはデータ領域の非効率性の問題が, Error-tolerant Recognitionアルゴリズムにはフルテキスト検索には向かないという問題点がある. 本稿では, これらの問題を解決するための方法について述べる. まずError-tolerant Recognitionアルゴリズムをフルテキスト検索に拡張する. 次にトライのデータ領域の問題をSuffix Arrayというデータ構造を用いた疑似的なトライを実現することにより解決する. これらにより, 大規模なテキストデータに対するフルテキスト類似用例検索システムを実現した.
収録刊行物
-
- 情報処理学会研究報告. FI,.情報学基礎研究会報告
-
情報処理学会研究報告. FI,.情報学基礎研究会報告 47 23-30, 1997-09-11
一般社団法人情報処理学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1570291227269182592
-
- NII論文ID
- 110002934050
-
- NII書誌ID
- AN10114171
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles