特許
J-GLOBAL ID:200903049631517107

文書画像認識装置

発明者:
出願人/特許権者:
代理人 (1件): 京本 直樹 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-282231
公開番号(公開出願番号):特開平7-134750
出願日: 1993年11月11日
公開日(公表日): 1995年05月23日
要約:
【要約】【目的】 パーソナルコンピュータ等のソフトウェア程度の処理能力を備える環境においても、段組や表形式といった複雑なレイアウト構造をもつ文書の読み取り結果を効率良く修正可能な文書画像認識装置を提供する。【構成】 文書全体を表示し、修正作業を行うブロックの選択、既に誤り修正の終了したブロックの表示を行う全体画像表示手段2と、ブロックの認識結果テキストを表示しテキスト単位でのカーソル移動、選択、修正と下線等の文字属性の表示及びリジェクトされた文字の表示をする認識結果テキスト表示手段5と、文字画像単位でのカーソル移動、ブロック単位の表示をするブロック画像表示手段3と、候補文字の表示、候補文字からの選択を行う候補文字表示手段4と、誤って抽出したブロックの強制削除、挿入、分割、結合を行う機能と、未登録の文字パターンを認識辞書に追加登録する。
請求項(抜粋):
文書画像を入力する文書画像入力部と、文書画像を図、段組、文字行、文字、表枠線、下線等の要素領域に分割し、1つまたは複数個の前記要素領域をブロックとして構造化する際、各ブロックの包含関係及び上下又は左右の配置関係に従って、前記ブロックの属性及びブロック間の配置構造を階層的に決定し、記憶するレイアウト解析部と、前記レイアウト解析部より得られた個々の文字画像から特徴抽出、認識辞書との照合を行い、候補文字コードを得る文字認識部と、前記レイアウト解析部と前記文字認識部の処理結果の修正を行う誤り修正ユーザインタフェース部とから構成されることを特徴とする文書画像認識装置。
IPC (2件):
G06K 9/03 ,  G06K 9/00
引用特許:
審査官引用 (5件)
  • 特開平4-044185
  • 特開平3-078890
  • 特開平2-072495
全件表示

前のページに戻る