特許
J-GLOBAL ID:200903068923257615
文字認識装置及びその文字認識方法
発明者:
,
出願人/特許権者:
代理人 (1件):
松本 正夫
公報種別:公開公報
出願番号(国際出願番号):特願平9-227503
公開番号(公開出願番号):特開平11-066231
出願日: 1997年08月08日
公開日(公表日): 1999年03月09日
要約:
【要約】【課題】 繁雑な操作を行なうことなく、原稿を複数の領域に分割して入力された画像から自動的に精度の高い文字認識処理を可能とする。【解決手段】 画像入力部10によって、原稿を各領域に含まれる文字が少なくとも1文字以上が重複して存在するように複数の領域に分割し、各領域毎に入力された画像を格納する画像記憶部20、格納された画像に対しレイアウト解析処理を行ない、レイアウト情報を抽出するレイアウト解析部30、レイアウト情報を格納するレイアウト情報記憶部40、画像とレイアウト情報とに基づいて、文字認識情報を得る文字認識部50、文字認識情報を格納する文字情報記憶部60、レイアウト情報を基に分割された各領域の画像中の互いに相対応する行を検出する結合行検出部70、相対応する行に含まれる互いに重複する文字を検出して文字認識情報の結合位置を検出する結合文字検出部80、結合行検出部及び結合文字検出部によって得られた対応結果をもとに文字認識情報を結合する文字結合部90、文字結合部によって得られた結果を出力する出力部100を備える。
請求項(抜粋):
原稿を量子化された画像として入力する画像入力手段によって、前記原稿を各領域に含まれる文字が少なくとも1文字以上が重複して存在するように複数の領域に分割し、各領域毎に入力された画像を格納する画像記憶手段と、前記画像記憶手段に格納された画像に対し、レイアウト解析処理を行ない、少なくとも文書の行、文字の領域属性や領域の座標情報を含むレイアウト情報を抽出するレイアウト解析手段と、レイアウト解析によって得られたレイアウト情報を格納するレイアウト情報記憶手段と、前記画像記憶手段に格納されている画像と前記レイアウト情報記憶手段に格納されているレイアウト情報とに基づいて、画像内の文字に対応する文字コードや、候補文字の文字コード、文字の座標を含む文字認識情報を得る文字認識手段と、前記文字認識手段によって得られた前記文字認識情報を格納する文字情報記憶手段と、前記レイアウト情報記憶手段に格納されたレイアウト情報をもとに、分割された各領域の画像中の含まれる行のうちで、互いに相対応する行を検出する結合行検出手段と、前記結合行検出手段によって得られた対応結果と前記文字情報記憶手段に格納された文字認識情報をもとに、相対応する行に含まれる文字のうちで、互いに重複する文字を検出して前記複数の領域に対応する複数の前記文字認識情報の結合位置を検出する結合文字検出手段と、前記結合行検出手段及び結合文字検出手段によって得られた対応結果をもとに、前記文字情報記憶手段に格納された前記文字認識情報を結合する文字結合手段と、前記文字結合手段によって得られた結果を出力する出力手段とを備えることを特徴とする文字認識装置。
引用特許:
前のページに戻る