特許
J-GLOBAL ID:200903082184627002

文書画像認識装置

発明者:
出願人/特許権者:
代理人 (1件): 京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-232750
公開番号(公開出願番号):特開平8-096075
出願日: 1994年09月28日
公開日(公表日): 1996年04月12日
要約:
【要約】【構成】格納された画像はレイアウト解析部12において、文章、文字行、文字に分割され、文字ピッチ、行ピッチなど施されレイアウト情報が抽出される。誤り候補検出部18では、個々の文字サイズと文字ピッチとの比較により、誤りである可能性の高いものにエラーフラグを立て、更に未修正フラグを付加して出力し、同様に、個々の行の高さも誤りである可能性の高いものを検出し、エラーフラグ及び未修正フラグを立てて出力する。誤り修正処理はユーザからのオペレーションに従って格納された候補文字を順に読み出して出力し、それに対応するレイアウト情報および原画像の出力を行い、誤り修正を行う。レイアウト情報のエラーフラグと未修正フラグを読み出し、ユーザがこれを確認し修正入力し、再びレイアウト情報記憶部に格納する。【効果】読み取り誤りをユーザが修正する際に、レイアウト解析レベルの誤りの見落としが無く確認および修正を行うことができる。
請求項(抜粋):
文書を画像として入力する画像入力部と、前記画像を格納する画像記憶部と、前記画像を少なくとも文章、文字行、文字の属性をもつ領域に分割し、前記属性が文字行である場合にその文字行内の文字ピッチ、前記属性が文章である場合にその文章内の行ピッチをレイアウト情報として出力するレイアウト解析部と、前記レイアウト情報に従って文字領域に対する認識処理を行う文字認識部と、前記文字認識部からの出力データを格納する文字情報記憶部と、前記文字情報記憶部に格納された文字認識結果を表示する文字情報表示部と、前記レイアウト情報から、文字行領域における文字ピッチもしくは文章領域における行ピッチが所定値以上であればエラーフラグと未修正フラグを前記レイアウト情報に付加して出力する誤り候補検出部と、前記誤り候補検出部の出力を格納するレイアウト情報記憶部と、前記画像記憶部の格納データと、前記レイアウト情報記憶部の格納データを表示する画像表示部と、ユーザからのオペレーションを入力する修正指示入力部と、前記修正指示入力部の出力に従い、前記画像記憶部と前記レイアウト情報記憶部に対して前記画像と前記レイアウト情報の出力指示を行い、前記文字情報記憶部に格納された前記文字認識結果を逐次入力すると共に前記文字情報表示部に対する出力指示を行い、前記画像表示部に表示された前記画像と前記文字情報表示部に表示された前記文字認識結果をユーザが比較し修正することを可能とし、修正結果を再び前記文字情報記憶部に格納する修正処理部と、を含むことを特徴とする文書画像認識装置。
IPC (4件):
G06K 9/20 340 ,  G06K 9/03 ,  G06K 9/34 ,  G06K 9/62 620
引用特許:
審査官引用 (4件)
  • 特開平4-349586
  • 特開平2-193278
  • 特開平1-015889
全件表示

前のページに戻る