特許
J-GLOBAL ID:200903012737615590

文字認識装置、文字認識方法、文字認識プログラム、及び記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 均
公報種別:公開公報
出願番号(国際出願番号):特願2003-059214
公開番号(公開出願番号):特開2004-272396
出願日: 2003年03月05日
公開日(公表日): 2004年09月30日
要約:
【課題】文字毎に、その文字に誤認識しやすい類似文字や、その異字体を予め設定しておき、通常の辞書検索に加えて、その類似文字および異字体(旧字・俗字・人名漢字などを含む)を考慮して辞書検索を実施することにより、辞書検索性能を高め、誤認識の訂正精度を向上させる文字認識装置を提供する。【解決手段】まずスキャナーなどの画像入力機器によって、原稿画像を入力する(S1)。次に黒画素の連続する範囲毎に、それと外接する矩形を求める(S2)。そして隣接する矩形同士を統合して、行に成長させていく(S3)。黒画素射影、行高さ、などに基づいて行を1文字だと思われる範囲に分割していく。この場合複数の候補があっても構わない(S4)。次にステップS4で求められた範囲を1文字とみなし、画像特徴と認識辞書とを照合し、認識スコアを算出し、予め設定したしきい値以上の解を認識候補として残す(S5)。ステップS5で求められた認識候補の並びと、言語辞書および文法と照合して、認識スコアを加味した上、妥当な解を選択する(S6)。【選択図】 図6
請求項(抜粋):
画像入力機器により原稿画像を入力する画像入力部と、該画像入力部により取り込まれた画像の黒画素の連続する範囲ごとに前記黒画素と外接する矩形を求める矩形抽出処理部と、該矩形抽出処理部により抽出された隣接する矩形同士を統合して行に成長させていく行切り出し処理部と、該行切り出し処理部により切り出された行を1文字の範囲に分割する文字切り出し処理部と、該文字切り出し処理部により分割された範囲を1文字とみなし、前記文字の画像特徴と認識辞書とを照合して予め設定した閾値以上の解を認識候補とする認識処理部と、該認識処理部により求められた認識候補の並びと言語辞書及び文法とを照合して妥当な解を選択する言語処理部とを備えたことを特徴とする文字認識装置。
IPC (2件):
G06K9/72 ,  G06K9/68
FI (2件):
G06K9/72 B ,  G06K9/68 G
Fターム (5件):
5B064AA01 ,  5B064AB16 ,  5B064CA08 ,  5B064EA19 ,  5B064EA26
引用特許:
審査官引用 (3件)
  • 特開平4-077980
  • 文字認識装置
    公報種別:公開公報   出願番号:特願平5-202258   出願人:松下電器産業株式会社
  • 文書認識装置と文書認識方法
    公報種別:公開公報   出願番号:特願平11-152542   出願人:株式会社東芝

前のページに戻る