特許
J-GLOBAL ID:200903033417970224

文書画像の論理要素抽出方法、装置および記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 誠 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-145781
公開番号(公開出願番号):特開平11-328306
出願日: 1998年05月27日
公開日(公表日): 1999年11月30日
要約:
【要約】【課題】 論理構造を認識する際に、文字認識結果を用いずにそのレイアウト情報のみを用いて書誌事項を的確に抽出する。【解決手段】 レイアウト特徴抽出手段103は、入力文書画像を領域などの要素に分割し、文書レイアウト構造に関する特徴を検出する。論理モデル検出手段104は、複数のモデルの中から処理対象文書タイプに一致するモデルを検出し、要素抽出処理手段105は、検出された論理モデルを用いて文書画像から書誌事項を抽出する。モデルの更新処理が必要ないと判定106されたときは抽出された書誌事項を出力107し、更新を行うときは、判定された文書、サンプル文書などを用いて論理モデルを更新する。
請求項(抜粋):
文書をデジタル画像として入力し、該文書画像から前記文書のレイアウト特徴を検出し、複数の論理モデルの中から、前記入力文書のレイアウト特徴に一致する論理モデルを検出し、該検出された論理モデルを用いて前記文書画像から論理要素を抽出することを特徴とする文書画像の論理要素抽出方法。
引用特許:
審査官引用 (2件)
  • 文書画像処理装置
    公報種別:公開公報   出願番号:特願平5-192746   出願人:沖電気工業株式会社
  • 個人認証装置
    公報種別:公開公報   出願番号:特願平5-167879   出願人:株式会社東芝

前のページに戻る