データ駆動型処理と概念駆動型処理の相互作用による文書画像レイアウト解析

書誌事項

タイトル別名
  • データ クドウガタ ショリ ト ガイネン クドウガタ ショリ ノ ソウゴ サヨウ ニ ヨル ブンショ ガゾウ レイアウト カイセキ
  • Document Layout Analysis by Interaction between Data-driven Processing and Concept-driven Processing
  • 画像・図形認識

この論文をさがす

抄録

多様なレイアウト構造を持つ印刷文書を一括して読み取り,ディジタル化することを目的とした新しいレイアウト解析方式を提案する.本レイアウト解析方式は3つのデータ駆動型処理: 領域統合,領域解析,領域認識と1つの概念駆動型処理:領域変更で構成されている.レイアウト解析システムでは処理モジュールが階層的に配置されており,隣接するモジュール間で相互作用を可能としている.前処理により抽出された文字成分がレイアウト解析システムに入力されると,データ駆動型処理の相互作用を経て,近接,類同,良い連続などの条件に基づいて文字成分が群化してクラスタを形成する.概念駆動型処理では,誤った群化を解消するための仮説をそれぞれのクラスタに適用する.そして,データ駆動型処理と概念駆動型処理の相互作用により仮説が検証され,システムは最終的に,テキストブロックと文字行と文字の階層関係で記述されるレイアウト要素の集合を文書画像のレイアウト構造として出力する.新聞,雑誌,科学技術文献,官報,表形式文書,書籍,名刺などを対象とした実験では,本方式が多様なレイアウト構造に適応していることと,複雑なレイアウト構造を高精度に処理できることを確認することができた.

A new method of document layout analysis is proposed for a document reader to be used for reading a wide variety of documents.The proposed system consists of three data-driven processes, i.e., region grouping, region analysis, and region recognition, and one concept-driven process, i.e., region modification.Each processing module can communicate with the adjacent modules, which means there is an interaction between modules.The interaction between data-driven processing modules organizes clusters from characters in a document by perceptual grouping process based on Gestalt laws.The concept-driven process applies hypotheses to text clusters to solve incorrect perceptual grouping.The interaction between concept-driven process and data-driven processes verifies hypotheses and forms a layout structure of a document consisting of the hierarchical relationships between text blocks and text lines.Experimental results obtained for 150 documents show the method is adaptable to various layout styles and is effective for complex documents.

収録刊行物

被引用文献 (6)*注記

もっと見る

参考文献 (24)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ