Geometric Hashingを用いた帳票識別

書誌事項

タイトル別名
  • Form Document Identification Using Geometric Hashing

この論文をさがす

抄録

一般オフィスでは,各種伝票,名簿,一覧表,銀行の振込依頼書,企業の財務諸表など,多種多様の帳票文書が取り扱われている.近年,計算機を用いた画像ファイリングが一般オフィスで用いられるようになるにつれて,これらの帳票文書から,必要な情報のみをとりだし計算機に入力することが望まれるようになってきた.これらの情報を効率よくファイリングし,検索に利用するためには,帳票の種別ごとにデータを入力・管理することが必要であり,入力帳票の特徴を自動的に抽出し,帳票種別を自動識別することが要求される.帳票識別を実用化するためには,1.文字の記入などによる画像の変動や入力画像のノイズや掠れなどによる情報の欠落の影響をうけない.2.画像の傾き・位置ずれ・伸縮などの変動を吸収する.3.多種多様の帳票に対応できるように,対象帳票の種類に依存しない.4.登録帳票が増えても検索時間が遅くならない. の点を考慮しなければならない.即ち,入力で生じる画像の変動や,情報の欠落の影響をうけない柔軟かつロバストなアルゴリズムを構築する必要がある.我々は,これらの問題点を解決するために,帳票文書は枠領域(以下セルとよぶ)と,文字列から構成されていると考える.帳票上のセル領域は帳票上に文字が記載されても変わらない比校的普遍な情報である.これに対し,文字情報は追記されることによって変動が大きい情報である.したがって,セルの位置情報を帳票の特徴として帳票識別を行うことを考える.ここで,帳票文書をセルで表現し,セルの中心点をそのセルの代表点とした場合に,類似帳票識別は点マッチングの問題として考えることができる.図1に帳票文書からセルを抽出した例を示す.帳票の種別をセルの構造で識別することは,上記問題点を考慮した上での2枚の画像中の長方形領域の対応関係を検証することである.そこで,本論文では,領域対応を各領域の代表点対応問題と考え,点マッチングの方法として知られているGeometric Hashingを応用してこの問題を解くことにより帳票識別を行なう.Geometric Hashingとは,データの整理方法であるハッシュ法を画像認識に応用したものであり.モデルから2次元不変量を計算してHash Tableを作成した後,入力画像から計算された不変量に基づいてHash Table上を検索する手法である.以下では,本手法の詳細なアルゴリズムを述べると共に,実験によりその有効性を示す.

収録刊行物

被引用文献 (1)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ