特許
J-GLOBAL ID:200903019592694750

文書処理装置及び方法

発明者:
出願人/特許権者:
代理人 (1件): 柏木 明 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-015432
公開番号(公開出願番号):特開平9-212514
出願日: 1996年01月31日
公開日(公表日): 1997年08月15日
要約:
【要約】【課題】 文書画像から文書要素を検出して識別子を付与する動作を高精度に実現する。【解決手段】 複数の文書要素の識別子に位置の特徴と順序とを予め設定しておき、文書画像から複数の部分領域を抽出し、この複数の部分領域の各々から位置の特徴を抽出する。この位置の特徴に従って複数の部分領域を順番に整列させ、この整列した複数の部分領域の各々を行毎に行領域として分割する。この行領域を位置の特徴がマッチングした文書要素に割り当て、複数の文書要素に重複して割り当てられた行領域を相互の位置関係に従って取捨選択する。文書画像から文書要素を行単位で抽出することができるので、行間が狭い二つの文書要素も検出することができ、抽出した行領域と文書要素とを強制的に一対一に対応させないので、二行の文書要素も検出することができる。
請求項(抜粋):
複数の文書要素の識別子に位置の特徴と順番とが予め設定された文書要素辞書と、文書画像から複数の部分領域を抽出する領域抽出手段と、抽出された複数の部分領域の各々から位置の特徴を抽出する特徴抽出手段と、抽出された位置の特徴に従って複数の部分領域を順番に整列させる領域整列手段と、整列した複数の部分領域の各々を行毎に行領域として分割する領域分割手段と、前記文書要素辞書に設定された文書要素に位置の特徴がマッチングした行領域を割り当てるマッチング判定手段と、複数の文書要素に重複して割り当てられた行領域を相互の位置関係に従って取捨選択する要素抽出手段と、を有することを特徴とする文書処理装置。
IPC (3件):
G06F 17/30 ,  G06T 1/00 ,  G06K 9/20 340
FI (4件):
G06F 15/401 310 A ,  G06K 9/20 340 L ,  G06F 15/40 370 B ,  G06F 15/62 330 D
引用特許:
審査官引用 (3件)

前のページに戻る