特許
J-GLOBAL ID:200903060116803737

文書認識装置及び文書認識方法

発明者:
出願人/特許権者:
代理人 (1件): 鈴江 武彦 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-296832
公開番号(公開出願番号):特開2002-108847
出願日: 2000年09月28日
公開日(公表日): 2002年04月12日
要約:
【要約】【課題】 入力された文書に忠実な文書画像を得る。【解決手段】 画像データは、N個のレイアウト解析手段(3-1,...,3-N)に入力される。これらの解析手段では、それぞれレイアウト解析の方法が異なる。これらの解析結果は、レイアウト解析結果対応付け部21に出力される。ここでは、N個の解析結果の間で、グルーピングされたグループの領域が重複しているものどうしが対応付けられる。レイアウト解析結果分類部22においては、この対応付けられたグループ間で、閉領域どうしが重複する態様によって、種類が分類される。レイアウト解析結果集計部23においては、各部分領域から画像データから文字情報が的確に抽出された部分領域である確定部分領域が抽出される。レイアウト解析結果出力部24においては、確定部分領域で形成されるレイアウト解析結果が生成され、その解析結果が出力される。
請求項(抜粋):
処理対象画像となる文書構成要素を複数個有する文書画像を認識するための文書認識装置において、前記文書構成要素をまとめて部分領域として抽出し、複数通りの排他的な部分領域の組み合わせを生成する解析手段と、前記複数通りの解析結果を比較し、部分領域間の対応付けを実施する比較手段と、前記部分領域間の対応に基づいて、確定部分領域を抽出する確定手段と、前記確定部分領域に基づいて、新たな解析結果を生成する生成手段と、を具備することを特徴とする文書認識装置。
IPC (5件):
G06F 17/21 546 ,  G06F 17/21 530 ,  G06F 17/21 536 ,  G06T 7/40 100 ,  G06T 11/60 100
FI (5件):
G06F 17/21 546 Z ,  G06F 17/21 530 A ,  G06F 17/21 536 ,  G06T 7/40 100 Z ,  G06T 11/60 100 C
Fターム (11件):
5B009NC01 ,  5B009NC04 ,  5B009NE01 ,  5B009NG03 ,  5B009RB35 ,  5B050BA16 ,  5B050FA09 ,  5L096BA18 ,  5L096DA05 ,  5L096FA19 ,  5L096JA24
引用特許:
審査官引用 (3件)

前のページに戻る