特許
J-GLOBAL ID:200903036829911175
文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
発明者:
出願人/特許権者:
代理人 (1件):
根本 恵司
公報種別:公開公報
出願番号(国際出願番号):特願2002-205874
公開番号(公開出願番号):特開2004-046723
出願日: 2002年07月15日
公開日(公表日): 2004年02月12日
要約:
【課題】文字認識において定ピッチ以外の文字配列に適用しても、適正な文字切り出しを可能にする。【解決手段】文字やその配置が未知の段階で切り出された文字候補(複数存在)に文字認識処理(認識辞書照合スコアや言語的な尤度に基づき最尤解が選択)を行い、認識結果がほぼ確定した段階でこの結果を対象に文字配置ピッチ(図4に示す文字矩形間距離と中心線距離情報)を求め、平均値から大きく相違する不規則な文字配置ピッチが生じた箇所を文字切り出し誤りとして検出する。誤り箇所に再切り出し・再認識処理を行い元の認識結果を合わせて最尤解を求める。また、半角・横倍角文字を推定して除外する処理を付加する。文字の外接矩形のアスペクト比を形状特徴として文字別に予め用意しておき、実際の認識文字画像と比較することによって、文字切り出し誤りを検出する方法も示されている。【選択図】 図4
請求項(抜粋):
処理対象として入力された文字配列を有する文書画像から文字単位を含むと見なせる文字候補領域を切り出す文字切り出しステップと、切り出された文字を辞書に格納した文字画像特徴と照合し、照合結果にもとづき文字認識をする文字認識ステップを含む文字認識方法であって、さらに前記文字認識ステップで認識された文字配列を対象にして文字の外接矩形における隣接矩形間距離と隣接矩形の矩形中心線距離をそれぞれ算出する文字ピッチ算出ステップと、文字ピッチの算出結果から文字配列における文字の配置の特徴を判定する文字配列特徴判定ステップを含むことを特徴とする文字認識方法。
IPC (2件):
FI (2件):
Fターム (13件):
5B029CC23
, 5B029EE08
, 5B029EE09
, 5B064AA01
, 5B064AB02
, 5B064DA03
, 5B064DA35
, 5B064DC11
, 5B064DC17
, 5B064DC18
, 5B064EA07
, 5B064EA19
, 5B064EA36
引用特許:
審査官引用 (7件)
-
英文字認識装置
公報種別:公開公報
出願番号:特願平5-135785
出願人:松下電器産業株式会社
-
特開平4-299485
-
特開平4-299485
-
特開平4-372089
-
文字認識方法
公報種別:公開公報
出願番号:特願平6-304523
出願人:株式会社リコー
-
文字認識装置
公報種別:公開公報
出願番号:特願平8-096504
出願人:松下電器産業株式会社
-
文字認識方法及びその装置
公報種別:公開公報
出願番号:特願平8-060984
出願人:三菱電機株式会社
全件表示
前のページに戻る