語彙的連鎖に基づくパッセージ検索

  • 望月 源
    北陸先端科学技術大学院大学情報科学研究科
  • 岩山 真
    (株)日立製作所 基礎研究所
  • 奥村 学
    北陸先端科学技術大学院大学情報科学研究科

書誌事項

タイトル別名
  • Passage-Level Document Retrieval Using Lexical Chains

この論文をさがす

説明

計算機上の文書データの増大に伴い, 膨大なデータの中からユーザの求める文書を効率よく索き出す文書検索の重要性が高まっている.最近の文書検索では、ユーザの入力したクエリーと関連の高い文書の一部分を取り出して類似度を計算するパッセージレベルの検索が注目されている.パッセージ検索におけるパッセージとは, 文書中でクエリーの内容と強く関連する内容を持つ連続した一部分のことを言う.パッセージ検索では, このパッセージをどのように決定するかが問題となる.良いパッセージを決定するためには, パッセージ自体が意味的なまとまりを形成し, パッセージの位置やサイズがクエリーや文書に応じて柔軟に設定される必要があると考えられる.本稿では, 文書中の文脈情報である語彙的連鎖を利用し, クエリーと文書の適切な類似度を計算できるパッセージ決定手法について述べる.また, このパッセージを使用し, 検索精度を向上させる検索手法について述べる.

収録刊行物

参考文献 (13)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1571417127177356416
  • NII論文ID
    110002934760
  • NII書誌ID
    AN10115061
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ