特許
J-GLOBAL ID:200903016323086337

論理要素抽出方法および記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 誠 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-267166
公開番号(公開出願番号):特開平11-184894
出願日: 1998年09月22日
公開日(公表日): 1999年07月09日
要約:
【要約】【課題】 論理構造を認識する際に、レイアウト情報のみを用いて書誌事項を抽出すると共に、自動的に文書タイプを識別する。【解決手段】 画像分割手段104は、入力文書画像を文字領域などの要素に分割し、文書のレイアウト特徴を検出する。論理構造モデル作成手段107は、複数のモデル文書102毎に論理構造モデルを作成する。要素抽出処理手段105は、論理構造モデルの内の一つのモデルを用いて文書画像から論理要素を抽出し、また、そのモデルのレイアウト特徴と抽出された論理要素に対応する、文書のレイアウト特徴との類似度を算出し、類似度に所定値を掛けた値が所定の閾値以上のとき、出力手段106は抽出された論理要素を文書データベース108に出力する。
請求項(抜粋):
文書をデジタル画像として入力し、該文書画像を所定の要素に分割すると共に、前記文書のレイアウト特徴を検出し、複数の文書種類毎に予め作成された論理構造モデルの内の一つのモデルを用いて前記文書画像から第1の単位で所定の論理要素を抽出し、次いで第2の単位で所定の論理要素を抽出し、前記一つのモデルのレイアウト特徴と前記抽出された論理要素に対応する、前記文書のレイアウト特徴との類似度を算出し、該類似度に所定値を掛けた値が所定の閾値以上のとき前記抽出された論理要素を出力することを特徴とする論理要素抽出方法。
IPC (2件):
G06F 17/30 ,  G06T 11/60
FI (2件):
G06F 15/401 310 A ,  G06F 15/62 325 P
引用特許:
審査官引用 (2件)

前のページに戻る