Pat
J-GLOBAL ID:200903016323086337

論理要素抽出方法および記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 鈴木 誠 (外1名)
Gazette classification:公開公報
Application number (International application number):1998267166
Publication number (International publication number):1999184894
Application date: Sep. 22, 1998
Publication date: Jul. 09, 1999
Summary:
【要約】【課題】 論理構造を認識する際に、レイアウト情報のみを用いて書誌事項を抽出すると共に、自動的に文書タイプを識別する。【解決手段】 画像分割手段104は、入力文書画像を文字領域などの要素に分割し、文書のレイアウト特徴を検出する。論理構造モデル作成手段107は、複数のモデル文書102毎に論理構造モデルを作成する。要素抽出処理手段105は、論理構造モデルの内の一つのモデルを用いて文書画像から論理要素を抽出し、また、そのモデルのレイアウト特徴と抽出された論理要素に対応する、文書のレイアウト特徴との類似度を算出し、類似度に所定値を掛けた値が所定の閾値以上のとき、出力手段106は抽出された論理要素を文書データベース108に出力する。
Claim (excerpt):
文書をデジタル画像として入力し、該文書画像を所定の要素に分割すると共に、前記文書のレイアウト特徴を検出し、複数の文書種類毎に予め作成された論理構造モデルの内の一つのモデルを用いて前記文書画像から第1の単位で所定の論理要素を抽出し、次いで第2の単位で所定の論理要素を抽出し、前記一つのモデルのレイアウト特徴と前記抽出された論理要素に対応する、前記文書のレイアウト特徴との類似度を算出し、該類似度に所定値を掛けた値が所定の閾値以上のとき前記抽出された論理要素を出力することを特徴とする論理要素抽出方法。
IPC (2):
G06F 17/30 ,  G06T 11/60
FI (2):
G06F 15/401 310 A ,  G06F 15/62 325 P
Patent cited by the Patent:
Cited by examiner (2)

Return to Previous Page