Pat
J-GLOBAL ID:200903012737615590

文字認識装置、文字認識方法、文字認識プログラム、及び記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 鈴木 均
Gazette classification:公開公報
Application number (International application number):2003059214
Publication number (International publication number):2004272396
Application date: Mar. 05, 2003
Publication date: Sep. 30, 2004
Summary:
【課題】文字毎に、その文字に誤認識しやすい類似文字や、その異字体を予め設定しておき、通常の辞書検索に加えて、その類似文字および異字体(旧字・俗字・人名漢字などを含む)を考慮して辞書検索を実施することにより、辞書検索性能を高め、誤認識の訂正精度を向上させる文字認識装置を提供する。【解決手段】まずスキャナーなどの画像入力機器によって、原稿画像を入力する(S1)。次に黒画素の連続する範囲毎に、それと外接する矩形を求める(S2)。そして隣接する矩形同士を統合して、行に成長させていく(S3)。黒画素射影、行高さ、などに基づいて行を1文字だと思われる範囲に分割していく。この場合複数の候補があっても構わない(S4)。次にステップS4で求められた範囲を1文字とみなし、画像特徴と認識辞書とを照合し、認識スコアを算出し、予め設定したしきい値以上の解を認識候補として残す(S5)。ステップS5で求められた認識候補の並びと、言語辞書および文法と照合して、認識スコアを加味した上、妥当な解を選択する(S6)。【選択図】 図6
Claim (excerpt):
画像入力機器により原稿画像を入力する画像入力部と、該画像入力部により取り込まれた画像の黒画素の連続する範囲ごとに前記黒画素と外接する矩形を求める矩形抽出処理部と、該矩形抽出処理部により抽出された隣接する矩形同士を統合して行に成長させていく行切り出し処理部と、該行切り出し処理部により切り出された行を1文字の範囲に分割する文字切り出し処理部と、該文字切り出し処理部により分割された範囲を1文字とみなし、前記文字の画像特徴と認識辞書とを照合して予め設定した閾値以上の解を認識候補とする認識処理部と、該認識処理部により求められた認識候補の並びと言語辞書及び文法とを照合して妥当な解を選択する言語処理部とを備えたことを特徴とする文字認識装置。
IPC (2):
G06K9/72 ,  G06K9/68
FI (2):
G06K9/72 B ,  G06K9/68 G
F-Term (5):
5B064AA01 ,  5B064AB16 ,  5B064CA08 ,  5B064EA19 ,  5B064EA26
Patent cited by the Patent:
Cited by examiner (3)
  • 特開平4-077980
  • 文字認識装置
    Gazette classification:公開公報   Application number:特願平5-202258   Applicant:松下電器産業株式会社
  • 文書認識装置と文書認識方法
    Gazette classification:公開公報   Application number:特願平11-152542   Applicant:株式会社東芝

Return to Previous Page