特許
J-GLOBAL ID:200903086942525068

文字認識装置

発明者:
出願人/特許権者:
代理人 (1件): 香取 孝雄
公報種別:公開公報
出願番号(国際出願番号):特願2000-127648
公開番号(公開出願番号):特開2001-307020
出願日: 2000年04月24日
公開日(公表日): 2001年11月02日
要約:
【要約】 (修正有)【課題】 手書き文字と活字文字が混在して記入される領域を有する文書画像の文字パターンから特徴抽出を行ない、認識辞書との照合によって文字認識を行なう文字認識装置で、リジェクトが発生したときのオペレータの負担を軽減し、高速で高精度な文字認識処理を可能とする。【解決手段】 文字認識装置に文字領域の座標および属性を格納する領域属性格納部40を設け、文書12の各領域について「手書き文字」「活字文字」「手書き活字両用」等の領域属性情報を格納しておく。オペレータが属性を変更する修正部100を有し、入力画像データ16から抽出した領域について属性格納部40からのフォーマット情報64に含まれる属性に応じた適切な認識辞書61または62を選択して文字認識を行なう。認識結果にリジェクトされた文字パターンが存在すると、その領域の属性を変更しその属性に従って再度、認識辞書61または62を選択して文字認識処理を行なう。
請求項(抜粋):
複数の文字パターンの性質の文字が記載される文字領域を有する所定の様式の文書に記載された文字を認識し、該認識された文字を出力する文字認識装置において、該装置は、前記文書の画像を表わす入力画像データが入力され、該入力画像データから前記文字領域を抽出する領域抽出手段と、該抽出された文字領域に含まれる文字パターンを切り出し、該切り出された文字パターンの特徴を抽出する特徴抽出手段と、前記文字パターンの性質に対応して設けられ、該性質に応じた文字を認識するための認識辞書データが蓄積された複数の認識辞書手段と、前記抽出された文字領域の属性が前記複数の文字パターンの性質のいずれであるかを識別する属性識別手段と、前記抽出された文字領域について、前記複数の認識辞書手段のうち前記識別された属性に応じた認識辞書手段を選択する辞書制御手段と、前記切り出された文字パターンについて、前記選択された認識辞書手段を参照して前記抽出された特徴から前記文字パターンの文字を認識する認識手段と、該認識された文字を出力する出力手段とを含むことを特徴とする文字認識装置。
IPC (5件):
G06K 9/62 610 ,  G06F 17/22 506 ,  G06K 9/20 320 ,  G06K 9/20 340 ,  G06K 9/68
FI (5件):
G06K 9/62 610 B ,  G06F 17/22 506 A ,  G06K 9/20 320 Q ,  G06K 9/20 340 C ,  G06K 9/68 B
Fターム (15件):
5B009LA01 ,  5B029AA01 ,  5B029CC29 ,  5B029EE12 ,  5B064AA01 ,  5B064AB02 ,  5B064AB03 ,  5B064CA08 ,  5B064DA17 ,  5B064DA32 ,  5B064EA05 ,  5B064FA05 ,  5B064FA07 ,  5B064FA09 ,  5B064FA13
引用特許:
審査官引用 (3件)

前のページに戻る