特許
J-GLOBAL ID:200903031183168434

異字体異品質文字の認識方法

発明者:
出願人/特許権者:
代理人 (1件): 山口 巖
公報種別:公開公報
出願番号(国際出願番号):特願平7-077536
公開番号(公開出願番号):特開平8-272902
出願日: 1995年04月03日
公開日(公表日): 1996年10月18日
要約:
【要約】【目的】領域によって異なる字体・品質の文字で印刷記述されている文書を高精度で読み取り認識する文字認識方法を提供する。【構成】文字認識処理の過程に、イメージスキャナが入力する濃淡画像データを格納する濃淡画像メモリ領域に加え、濃淡画像データを2値化処理した結果を格納する2値化画像メモリ領域を文字読取装置の記憶手段内に確保し、予め設定した「しきい値」を基準に、濃淡画像データを2値化して2値化画像メモリに書き込む2値化処理手段と、2値化画像データを解析して同一字体あるいは文字品質で記載された見出し,本文,注釈等の一群をなす文章領域を抽出する手段と、抽出した各文章領域について該領域画像データの特徴パラメータを演算によって求め、これをもとに、該文章領域の文字性格および品質を判定し、品質判定結果によって濃淡画像データを2値化する処理に適用する「しきい値」を選定し、新規に選定した「しきい値」を基準に濃淡画像メモリの濃淡画像データを2値化処理して2値化画像メモリを書き換える処理を設ける。
請求項(抜粋):
イメージスキャナが読取対象文書を光学的に走査して得た濃淡画像データを格納する濃淡画像メモリ領域と、濃淡画像データを2値化処理した結果の画像データを格納する2値化画像メモリ領域とを文字読取装置の文字認識プロセッサに設けた記憶手段内に確保し、イメージスキャナが前記濃淡画像メモリ領域に書き込んだ濃淡画像データを予め設定した「しきい値」を基準に2値化して2値化画像メモリ領域に書き込む2値化処理手段と、2値化画像メモリ領域に書き込まれた2値化画像データを解析して同一字体あるいは文字品質で記載された一群をなす文章領域を抽出する手段と、抽出した各文章領域について該領域画像データの特徴パラメータを演算によって求める特徴抽出手段と、文章領域について抽出した特徴パラメータをもとに、該文章領域の文字性格および品質を判定する文字性格品質判定手段と、文字性格品質判定手段の判定結果によって濃淡画像データを2値化する処理に適用する「しきい値」を選定する「しきい値」変更設定手段とを備え、イメージスキャナの走査によって濃淡画像データを得たとき、走査ににあたって設定した読み取り条件によって定まる「しきい値」を用いて前記2値化処理手段から「しきい値」変更設定手段までの処理を実行して新規の「しきい値」を選定し、新規に選定した「しきい値」を基準に濃淡画像メモリ領域の濃淡画像データを2値化処理して2値化画像メモリ領域を書き換えたのち、書き換えられた2値化画像メモリのデータをもとに文字切り出し以降の文字認識処理を実行して認識結果を出力する処理を、抽出した文章領域毎に繰り返すようにしたことを特徴とする文字の認識方法。
IPC (4件):
G06K 9/52 ,  G06T 5/00 ,  G06K 9/38 ,  G06K 9/62 630
FI (4件):
G06K 9/52 ,  G06K 9/38 K ,  G06K 9/62 630 A ,  G06F 15/68 320 Z

前のページに戻る