Pat
J-GLOBAL ID:200903019592694750
文書処理装置及び方法
Inventor:
Applicant, Patent owner:
Agent (1):
柏木 明 (外1名)
Gazette classification:公開公報
Application number (International application number):1996015432
Publication number (International publication number):1997212514
Application date: Jan. 31, 1996
Publication date: Aug. 15, 1997
Summary:
【要約】【課題】 文書画像から文書要素を検出して識別子を付与する動作を高精度に実現する。【解決手段】 複数の文書要素の識別子に位置の特徴と順序とを予め設定しておき、文書画像から複数の部分領域を抽出し、この複数の部分領域の各々から位置の特徴を抽出する。この位置の特徴に従って複数の部分領域を順番に整列させ、この整列した複数の部分領域の各々を行毎に行領域として分割する。この行領域を位置の特徴がマッチングした文書要素に割り当て、複数の文書要素に重複して割り当てられた行領域を相互の位置関係に従って取捨選択する。文書画像から文書要素を行単位で抽出することができるので、行間が狭い二つの文書要素も検出することができ、抽出した行領域と文書要素とを強制的に一対一に対応させないので、二行の文書要素も検出することができる。
Claim (excerpt):
複数の文書要素の識別子に位置の特徴と順番とが予め設定された文書要素辞書と、文書画像から複数の部分領域を抽出する領域抽出手段と、抽出された複数の部分領域の各々から位置の特徴を抽出する特徴抽出手段と、抽出された位置の特徴に従って複数の部分領域を順番に整列させる領域整列手段と、整列した複数の部分領域の各々を行毎に行領域として分割する領域分割手段と、前記文書要素辞書に設定された文書要素に位置の特徴がマッチングした行領域を割り当てるマッチング判定手段と、複数の文書要素に重複して割り当てられた行領域を相互の位置関係に従って取捨選択する要素抽出手段と、を有することを特徴とする文書処理装置。
IPC (3):
G06F 17/30
, G06T 1/00
, G06K 9/20 340
FI (4):
G06F 15/401 310 A
, G06K 9/20 340 L
, G06F 15/40 370 B
, G06F 15/62 330 D
Patent cited by the Patent:
Cited by examiner (3)
-
電子ファイリングシステム
Gazette classification:公開公報
Application number:特願平4-302632
Applicant:セイコーエプソン株式会社
-
文書論理構造認識および文書内容認識のための装置および方法
Gazette classification:公開公報
Application number:特願平3-313186
Applicant:富士ゼロックス株式会社
-
特開平2-059880
Return to Previous Page