Pat
J-GLOBAL ID:200903057047123744

認識型文書ファイリング装置及びその制御方法

Inventor:
Applicant, Patent owner:
Agent (1): 大塚 康徳 (外1名)
Gazette classification:公開公報
Application number (International application number):1994283257
Publication number (International publication number):1996147314
Application date: Nov. 17, 1994
Publication date: Jun. 07, 1996
Summary:
【要約】【目的】 認識結果が疑わしい文字については特徴ベクトルが保存することで、後で精度のよい識別計算を行えるようにする。【構成】 イメージスキャナ3で読み取った文書画像はRAM4に格納され、文字の切り出し、特徴ベクトルの抽出が行われる。抽出された特徴ベクトルは平均特徴ベクトルとのユークリッド距離を計算し、近い順に所定個の候補文字群を得、それを大分類部11に格納する。 この後、各候補につき、書体毎の疑似ベイズ識別式を演算し、各候補の上位の所定個を出力する。そして、その中の第1の候補の疑似ベイズ識別式の値と、第2候補の値との差を判定し、それが所定以上ある場合には、第1候補は正しいものとして判定し、そうでなければ不確かであるとして判定する。不確かであると判定された文字については、その文字に関する特徴ベクトルを記憶する。
Claim (excerpt):
入力した画像データから切り出した文字画像を認識し、ファイリングする認識型文書ファイリング装置であって、文字画像の標準的特徴データを、文字種毎に文字コードと対応させて記憶している識別辞書と、切り出した文字画像の特徴ベクトルと前記標準的特徴データとから、文字種ごとに相違度を演算し、相違度の小さい順から複数個の候補文字種を選出する識別手段と、認識精度の不確かさを判定するチェック候補判定手段と、前記識別手段により選出された候補文字種の情報からテキストデータを生成するテキストデータ生成手段と、チェック候補判定手段によりチェック候補となった候補文字種に対応する特徴ベクトルを抽出するチェック候補文字特徴抽出手段とを備え、前記テキストデータ生成手段は、チェック候補の特徴ベクトルをテキストデータの候補文字種と対応させてテキストデータに持たせ、該テキストデータを記憶することを特徴とする認識型文書ファイリング装置。
IPC (3):
G06F 17/30 ,  G06K 9/00 ,  G06K 9/62
FI (3):
G06F 15/403 310 C ,  G06F 15/401 330 Z ,  G06F 15/403 350 Z

Return to Previous Page