特許
J-GLOBAL ID:200903005318571209

文字認識装置

発明者:
出願人/特許権者:
代理人 (1件): 武田 元敏
公報種別:公開公報
出願番号(国際出願番号):特願平4-156708
公開番号(公開出願番号):特開平5-346974
出願日: 1992年06月16日
公開日(公表日): 1993年12月27日
要約:
【要約】【目的】 文書画像中の文字を認識する文字認識装置において、接触文字による認識精度及び認識スピードの低下を抑え、高精度の認識結果を短時間で得ることの出来る文字認識装置を実現すること。【構成】 認識対象文書を読み込むスキャナ17と、CPU18と、制御プログラム19,認識対象文字の図形特徴を格納する認識辞書20,単語辞書21からなるROM22と、文書画像23,文書画像中の接触文字画像24,文字の認識結果25,接触文字画像の認識候補となる接触候補文字列26,接触文字辞書27からなるRAM28と、キーボード29と、表示装置30で構成され、接触文字以外の文字をキーとして接触文字画像の認識結果となり得る文字列を単語辞書21の検索により求め、これにしたがって既に認識結果が得られている文字画像を組み合わせることにより、疑似的な接触文字画像を生成し、接触文字として判定された画像と生成された疑似的な接触文字画像とを比較することにより接触文字の認識を行う。
請求項(抜粋):
認識対象文書を入力する画像入力部と、入力された文書画像を記憶する画像格納部と、文書画像中の文字に外接する矩形を黒画素の連なりをもとに求める外接矩形検出部と、求められた外接矩形の水平方向の間隔をもとに単語領域を求める単語領域切り出し部と、外接矩形内の黒画素の分布を図形特徴として抽出する図形特徴抽出部と、抽出した図形特徴と予め用意される認識辞書に格納される認識対象文字の図形特徴とを比較し、類似した特徴を有する文字が認識辞書中にあった場合に、該当文字を認識結果として認識結果格納部に記憶し、また、類似する特徴が認識辞書中にない場合に、矩形内の画像を文字と文字が接触している接触文字として判定し、その画像を接触文字画像格納部に記憶する文字認識部と、接触文字を含む単語文字列のうち接触文字以外の文字をキーとして、接触文字画像の認識結果となり得る文字列を、英単語を格納する単語辞書を検索することにより求める接触候補文字列生成部と、求められた接触候補文字列にしたがって、認識結果を得た矩形内の画像を組み合わせることにより疑似的に接触文字画像を生成する疑似接触文字生成部と、疑似接触文字生成部にて生成された接触文字画像を記憶する接触文字辞書と、接触文字画像格納部に記憶された画像と接触文字辞書に記憶された接触文字画像とを比較し、一致した画像の文字組を接触文字画像の認識結果とする接触文字認識部と、前記接触文字認識部にて一致する画像が無かった場合に、接触文字画像の黒画素の縦方向のヒストグラムに注目し、その値が小さな部分を文字と文字との接触点として1文字ずつ分割する接触文字分割処理部とからなる文字認識装置。
IPC (2件):
G06K 9/62 ,  G06K 9/34

前のページに戻る