Suffix Array を用いたフルテキスト類似用例検索

  • 山下 達雄
    奈良先端科学技術大学院大学 情報科学研究科
  • 松本 裕治
    奈良先端科学技術大学院大学 情報科学研究科

書誌事項

タイトル別名
  • Full Text Approximate String Search using Suffix Arrays

この論文をさがす

説明

類似検索の手法としてDPマッチングアルゴリズムやトライを用いたError-tolerant Recognitionアルゴリズムが知られている. DPマッチングアルゴリズムは検索対象データの大きさに比例した計算時間がかかるのに対し, トライを用いたError-tolerant Recognitionアルゴリズムは検索対象データの大きさに依存せず高速に類似検索が行える. しかし, トライにはデータ領域の非効率性の問題が, Error-tolerant Recognitionアルゴリズムにはフルテキスト検索には向かないという問題点がある. 本稿では, これらの問題を解決するための方法について述べる. まずError-tolerant Recognitionアルゴリズムをフルテキスト検索に拡張する. 次にトライのデータ領域の問題をSuffix Arrayというデータ構造を用いた疑似的なトライを実現することにより解決する. これらにより, 大規模なテキストデータに対するフルテキスト類似用例検索システムを実現した.

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (15)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1570291227269182592
  • NII論文ID
    110002934050
  • NII書誌ID
    AN10114171
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ