特許
J-GLOBAL ID:200903071504035689

英文字認識装置

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-331516
公開番号(公開出願番号):特開平6-180771
出願日: 1992年12月11日
公開日(公表日): 1994年06月28日
要約:
【要約】【目的】 文書画像中の文字を認識する英文字認識装置において、ノイズを含んだ文書の認識を高精度に行うことを目的とする。【構成】 文書画像中の文字を重ね合わせにより同じ字種ごとに分類し、分類された文字群の認識結果を文書内の複数の単語により確定する。その後、認識結果が確定した文字画像を除いた画像を対象として、その位置関係及び大きさをもとにノイズ判定処理を行い、ノイズとして判定された矩形を無視して認識処理を行うことによりノイズの影響を抑えた認識結果を得る。
請求項(抜粋):
文書画像として入力された画像を記憶する画像格納手段と、文書画像中の黒画素の連なりをもとにして文字に外接する矩形を文字矩形として求める文字矩形検出手段と、求められた文字矩形の文書画像上の座標データと、各文字矩形に与える通し番号とを記憶する文字矩形格納手段と、文字矩形格納手段に格納された座標データをもとに各矩形間の水平方向の間隔を求め、間隔が広い部分を単語区切りとして検出し、単語を構成する文字矩形番号を求める単語切り出し手段と、求められた単語を構成する文字矩形番号を単語ごとにひとまとめにして格納する単語文字矩形格納手段と、文字矩形の座標データを文字矩形格納手段から取り出すとともに、それをもとに前記画像格納手段から文字画像を取り出し、文書中の全ての文字画像間で画像を構成する画素単位で重ね合わせ、同じ字種であるか否かを、一致する画素と文字矩形内の全画素数との比により判定し、その比が大きいときに同一字種として分類する文字パターン分類手段と、文字矩形番号に対応する文字矩形の座標データを文字矩形格納手段から取り出すとともに、それをもとに前記画像格納手段から文字画像を取り出し、その黒画素の分布を抽出して図形特徴を求める図形特徴抽出手段と、認識対象となる文字の図形特徴を記憶しておく認識辞書手段と、文字矩形内の図形特徴と前記認識辞書手段にある図形特徴を比較して差を求め、その差の値が小さい特徴を持つ文字を認識結果とする文字認識手段と、前記文字パターン分類手段で同一文字種として分類された文字矩形群の番号と、各矩形群に与える通し番号と、矩形群の中から一つを代表矩形として取り出し、その認識結果を前記文字認識手段にて求めた結果と、矩形群の認識結果が確定しているか否かを表す認識結果確定情報とを格納する認識結果格納手段と、英単語の綴りを記憶している単語辞書手段と、単語を構成する文字矩形番号、及びその文字矩形が属する矩形群の認識結果をそれぞれ前記単語文字矩形格納手段、前記認識結果格納手段から取り出し、その結果得られる単語文字列と、前記単語辞書手段に記憶している単語文字列とを照合して単語の綴りが正しいか否かを判定し、同一矩形群に属する文字矩形の認識結果が複数の綴りの正しい単語にて一致していれば、その文字矩形群の認識結果を確定し、その旨を前記認識結果格納手段の認識結果確定情報に記憶する認識結果確定手段と、認識結果確定手段にて確定されなかった文字矩形の位置関係及びその大きさに注目し、矩形の縦長・横長が共に確定されている文字より十分に小さければ、これを「i」や「j」の点、または、ノイズと疑い、矩形の下方に縦長の矩形がある場合にこれを「i」や「j」の点として下方の矩形と統合し、孤立している矩形及びその上下の矩形が確定している場合はこれをノイズと判定し、前記単語文字矩形格納手段に格納されている単語を構成する文字矩形番号列からノイズと判定された矩形番号を削除するノイズ判定手段と、文書を認識した結果を単語文字矩形及び認識結果をもとに単語単位に表示する表示処理手段とを備えたことを特徴とする英文字認識装置。
IPC (3件):
G06K 9/62 ,  G06K 9/34 ,  G06K 9/72

前のページに戻る