日本語OCRにおける認識結果の一括修正

書誌事項

タイトル別名
  • Correction of Japanese OCR Output with a coded Processing Method.

この論文をさがす

説明

日本語文書OCRのための効率的な確認修正方法として,多段型の一括修正法を提案する.本手法はリジェクト文字をカテゴリ毎に一括修正した後,その情報を基に誤り文字の検出と修正を行うものである.そこでの処理は認識結果と文字パターン同士の特徴ベクトルの照合結果とを用いて,教師なしで類似文字をグループ化している.これによりオペレータは少ない作業量で誤り文字の修正ができる.約3万3千文字の印刷漢字を用いた評価では,リジェクト文字を約3%発生させた場合,(1)従来の遂次型の修正よりも文字の確認量を約68%低減できる,(2)誤り文字の約93%を検出できる,などのことが分かった。

収録刊行物

詳細情報 詳細情報について

  • CRID
    1573387452154506880
  • NII論文ID
    110003299839
  • NII書誌ID
    AN10013232
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ