特許
J-GLOBAL ID:200903026583490706

文書認識装置

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-316302
公開番号(公開出願番号):特開平7-168911
出願日: 1993年12月16日
公開日(公表日): 1995年07月04日
要約:
【要約】【目的】 外接矩形の大きさ等に関わらず、図形矩形と文字矩形と画像矩形を正しく判別することができる信頼性に優れた文書認識装置を提供することを目的とする。【構成】 外接矩形を検出する外接矩形検出部3と、文字・図形・画像候補矩形等を抽出する候補矩形抽出部4と、基準文字サイズ文字矩形を抽出する基準文字サイズ文字矩形抽出部5と、文字候補矩形を統合する文字候補領域統合部8と、文字候補領域中の基準文字サイズ文字矩形を抽出する代表文字矩形抽出部9と、代表文字矩形を文字認識する文字候補領域文字認識部10と、この認識確度が閾値未満であればこの文字候補領域を画像領域と判定し、図形候補矩形に対して文字認識を行い、この認識確度が閾値よりも大きければこの図形候補矩形を文字矩形と判定し、各領域を抽出する領域抽出部14と、を備えた構成からなる。
請求項(抜粋):
認識対象文書を2値画像データに変換して入力する画像入力部と、前記画像入力部で得られた2値画像データから連結した黒画素に外接する矩形を外接矩形として検出する外接矩形検出部と、前記外接矩形検出部で検出された外接矩形から文字候補矩形,図形候補矩形,表候補矩形,画像候補矩形等を抽出する候補矩形抽出部と、前記候補矩形抽出部で抽出された文字候補矩形から最頻の大きさの文字候補矩形を基準文字サイズ文字矩形として抽出する基準文字サイズ文字矩形抽出部と、前記候補矩形抽出部で抽出された文字候補矩形の水平及び垂直方向の間隔から文字間・行間を検出する文字間・行間検出部と、前記文字間・行間検出部で検出された文字間から文字候補矩形を文字行候補領域として統合する文字行候補領域統合部と、前記文字行候補領域統合部で統合された文字行候補領域を文字候補領域として統合する文字候補領域統合部と、前記文字候補領域統合部で統合された文字候補領域中の基準文字サイズ文字矩形を代表文字矩形として抽出する代表矩形抽出部と、前記代表文字矩形抽出部で抽出された代表文字矩形に対して文字認識を行う文字候補領域文字認識部と、前記文字候補領域文字認識部で得られた認識確度が文字領域閾値未満であればこの文字候補領域を画像領域と判定し、さもなければ文字領域と判定する文字領域判定部と、前記候補矩形抽出部で抽出された図形候補矩形に対して文字認識を行う図形候補矩形文字認識部と、前記図形候補矩形文字認識部で得られた認識確度が図形矩形閾値よりも大きければこの図形候補矩形を文字矩形と判定し、さもなければ図形矩形と判定する図形矩形判定部と、前記候補矩形抽出部と前記文字領域判定部と前記図形矩形判定部から出力される矩形情報及び領域情報に基づいて前記画像入力部で得られた2値画像データ中から文字,図形,表,画像等の各領域を抽出する領域抽出部と、前記領域抽出部で抽出された各領域の属性に応じた認識を行う認識処理部と、を備えたことを特徴とする文書認識装置。
IPC (3件):
G06K 9/62 ,  G06K 9/20 340 ,  G06K 9/34

前のページに戻る