特許
J-GLOBAL ID:200903024977798525
文書認識システム
発明者:
,
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願平4-252283
公開番号(公開出願番号):特開平6-076105
出願日: 1992年08月27日
公開日(公表日): 1994年03月18日
要約:
【要約】【目的】 文章領域と図領域のどちらか一方もしくはその双方を有する文書の画像デ-タに対する構造認識などに用いられるパラメータに対し、その値を互いに類似した構造を持つ文書画像データ群から学習を行わせることにより推定する。【構成】 「学習モード」において、互いに類似した構造を持つ文書画像データ群から求めたパラメータの値の正解範囲から、そのパラメータの最適値を推定する機能を備えている。【効果】 「学習モード」において、互いに類似した構造を持つ文書画像データ群から求めたパラメータの値の正解範囲から、そのパラメータの最適値を推定することにより、構造認識などをより効果的に行うことができる。
請求項(抜粋):
文章領域と図領域のどちらか一方もしくはその両方の属性を有する領域を持つ文書の画像デ-タを入力として、当該文書画像データからまとまった文章領域や図の領域を表現するブロックを抽出し、当該文書画像データの構造を認識し、あるブロックが文章領域と図領域とのどちらの属性を持つものであるかを判定もしくは両者を区別し、文章領域の内容に対応する文字列デ-タおよび図領域の内容に対応する画像デ-タを出力する文書認識システムにおいて、文書画像の構造認識に用いるなんらかのパラメータに対して、その値を決定する学習モードを全体的な処理の流れとは別に持ち、その学習モードにおいて、当該文書画像データに対してまず当該パラメータの値を初期値に設定して構造認識処理を行い、その結果が正解であるかどうかを操作者によって教授され、正解でない場合には当該パラメータの値を変更して再度構造認識処理を行い、一方正解である場合には当該パラメータの値を自動的に変えながら複数回構造認識処理を繰り返して正解を得るための当該パラメータの正解下限値および正解上限値を求め、当該文書画像データと類似の構造を持つ他の文書画像データから予め求めて蓄積されている正解下限値および正解上限値のデータと併せて正解下限値および正解上限値の分布を求め、その分布から当該文書画像データおよびそれに相当の構造を持つ他の文書画像データに対する当該パラメータの正解範囲を推定し、その正解範囲から最適値を決定し、および/または複数種の異なった構造の文書画像データに対して別個に最適化されたパラメータを保持しており、それらを処理の対象とする文書によって切り換えて使用する機能を備えていることを特徴とする文書認識システム。
IPC (3件):
G06K 9/20 340
, G06F 15/62 330
, G06K 9/66
前のページに戻る