書誌事項
- タイトル別名
-
- High speed mathematical symbol recognition and its application to the recognition of printed Japanese mathematical documents
この論文をさがす
説明
現在のOCRソフトは数式文字を含む科学技術文書には全く対応できていないため、我々は、日本語OCRを活用した数式OCRの開発を行った。本研究では、日本語科学技術文書中の数式部の数学記号(英数字, ギリシャ文字を含む)の認識を念頭に置いた高速な文字認識手法を提案し、それを用いた日本語/数式領域分離手法の改良について報告する。日本語を認識するための日本語OCRエンジンと数式文字を認識するため独自に開発した高速数式文字OCRエンジンの2つのOCRエンジンを同時に走らせることで、日本語/数式領域分離を正確に分離できる可能性を示した。従来の手法では、日本語文字認識エンジンの内部情報である文字認識結果の信頼度などを多用していたため汎用性に欠けていた。この点を大幅に改良することで特定の日本語OCRエンジンに依存せずに数式を含む文書を認識することが可能となっている。
収録刊行物
-
- 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
-
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 98 (489), 1-8, 1998-12-17
一般社団法人電子情報通信学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1574231877183702912
-
- NII論文ID
- 110003274689
-
- NII書誌ID
- AN10541106
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles