正規表現を用いた数式検索手法の提案

情報処理学会 オープンアクセス

書誌事項

タイトル別名
  • Pattern Matching Algorithm for Mathematical Expressions with a Regular Expression

この論文をさがす

抄録

数式は多くの科学分野において広く用いられているものであり,電子的な文書中に記述されることも多い.電子的な文書の特長として,検索を行うことができるという点があげられる.しかし,数式の検索を行うことは容易ではない.なぜなら数式では,通常の言語とは異なり,文字が二次元的に配置されるためである.そこで本研究では,二次元的な文字の構造に対して文字列のパターンマッチング(文字列探索)に基づく検索を行うことで,文書から特定の数式が記述された箇所を見つけ出す,文書内検索の機能を実現する手法を提案する.また,本研究で提案する手法は,数式のパターンマッチングにおいて正規表現を利用することも可能である.正規表現を用いることで,複雑なパターンを処理することが可能となり,検索の利便性が飛躍的に向上する.さらに,パターンにマッチした数式のハイライト表示および数式の置換の実装についても述べる.

Mathematical expressions are commonly described in scientific documents. Electronic documents have made it simple to retrieve its contents. However, retrieving mathematical expressions correctly is still challenging because characters in mathematical expressions are two-dimensionally located with their structures. In this study, we propose a pattern matching algorithm for mathematical expressions, which is similar to string searching algorithms. This method enables users to find mathematical expressions that they input in a large document. It also allows them to use a regular expressions for complex and flexible patterns of mathematical expressions. Additionally we have implemented the functions to highlight and replace them, based on the proposed method.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

  • CRID
    1050282812882504064
  • NII論文ID
    170000130652
  • NII書誌ID
    AN00116647
  • ISSN
    18827764
  • Web Site
    http://id.nii.ac.jp/1001/00142020/
  • 本文言語コード
    ja
  • 資料種別
    journal article
  • データソース種別
    • IRDB
    • CiNii Articles
    • KAKEN

問題の指摘

ページトップへ