Pat
J-GLOBAL ID:200903061997414564

文書画像の論理要素抽出方法、装置および記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 鈴木 誠 (外1名)
Gazette classification:公開公報
Application number (International application number):1999187533
Publication number (International publication number):2000090117
Application date: Jul. 01, 1999
Publication date: Mar. 31, 2000
Summary:
【要約】【課題】 文書の論理要素を、そのレイアウト情報を記述した論理モデルとマッチングにより抽出する際に、論理要素毎のレイアウト特徴の変動量の履歴を参照して効果的な学習を行い、論理モデルや諸設定を更新することによって論理要素の抽出精度を向上させる。【解決手段】 レイアウト特徴抽出手段103は、入力文書画像を領域などの要素に分割し、文書レイアウト構造に関する特徴を検出する。論理モデル検出手段104は、複数のモデルの中から処理対象文書タイプに一致するモデルを検出し、論理要素抽出手段105は、検出された論理モデルを用いて文書画像から論理要素を抽出する。学習処理手段106は、抽出された論理要素のレイアウト特徴の変動量を求め、これを履歴として格納する。更新判定手段108は、履歴を参照し、変動量が所定のしきい値以上であるとき論理モデルを更新する。
Claim (excerpt):
文書をデジタル画像として入力し、該文書画像から前記文書のレイアウト特徴を検出し、複数の論理モデルの中から、前記入力文書のレイアウト特徴に一致する論理モデルを検出し、該検出された論理モデルを用いて前記文書画像から論理要素を抽出する文書画像の論理要素抽出方法であって、前記論理要素を抽出する際に、論理モデルにおけるレイアウト特徴の変動量の履歴を参照し、該レイアウト特徴の変動量が所定のしきい値以上であるとき、前記論理モデルを更新することを特徴とする文書画像の論理要素抽出方法。
IPC (2):
G06F 17/30 ,  G06T 7/00
FI (3):
G06F 15/401 330 Z ,  G06F 15/40 370 B ,  G06F 15/70 460 B
Patent cited by the Patent:
Cited by examiner (5)
Show all

Return to Previous Page