特許
J-GLOBAL ID:200903096436604907

文字認識装置

発明者:
出願人/特許権者:
代理人 (1件): 滝本 智之 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-096504
公開番号(公開出願番号):特開平9-282417
出願日: 1996年04月18日
公開日(公表日): 1997年10月31日
要約:
【要約】【課題】 文書画像の構造を判断し、その構造に応じた切り出し処理を行うことで、切り出し効率と認識率を向上させた文字認識装置を提供する。【解決手段】 文字切り出し手段2を文書画像の構造を判断する文書構造判断部2aと、行切り出し部2bと、行の画像が定ピッチであるか不定ピッチであるかを判断するピッチ判定部2cと、ピッチ判定部2cの結果に基づいて1文字と思われる画像を切り出す文字切り出し部2dとで構成し、文字認識手段4を、認識部指示部4aと複数の認識部4bと再切り出し指示部4cとで構成し、認識部指示部4aは複数の前記認識部4bのなかから認識部4bを選択し、認識部指示部4aで選択された認識部4bは文字カテゴリを判定し、再切り出し指示部4cは文字切り出し部2dに再切り出しを命ずる文字認識装置。
請求項(抜粋):
認識する対象の文書画像を入力する画像入力手段と、前記画像入力手段で入力した文書画像から1文字と見做した画像を切り出す文字切り出し手段と、前記文字切り出し手段で切り出した画像から特徴量を抽出する特徴量抽出手段と、前記特徴量抽出手段で抽出した特徴量の文字カテゴリを識別する文字認識手段を具備し、前記文字切り出し手段を、前記画像入力手段で入力した文書画像が縦書きであるか横書きであるかを判断する文書構造判断部と、前記文書構造判断部で判断した結果に基づいて前記画像入力手段で入力した文書画像から1行と見做した画像を切り出す行切り出し部と、前記行切り出し部で切り出した画像が定ピッチの行であるか不定ピッチの行であるかを判断するピッチ判定部と、前記ピッチ判定部で判定した結果に基づいて前記行切り出し部で切り出した画像から1文字と見做した画像を切り出す文字切り出し部とで構成し、前記文字認識手段を、認識部指示部と複数の認識部と再切り出し指示部とで構成し、前記認識部指示部は、前記文字切り出し部で切り出した画像に基づいて複数の前記認識部のなかから認識部を選択し、前記認識部指示部で選択した認識部は前記特徴量抽出手段で抽出した特徴量の文字カテゴリを判定し、前記再切り出し指示部は、前記認識部で求めた認識結果に基づいて前記文字切り出し部に再切り出しを命ずる文字認識装置。
IPC (3件):
G06K 9/62 620 ,  G06K 9/20 320 ,  G06K 9/20 340
FI (3件):
G06K 9/62 620 B ,  G06K 9/20 320 K ,  G06K 9/20 340 K

前のページに戻る