特許
J-GLOBAL ID:200903042906125684

文字認識装置

発明者:
出願人/特許権者:
代理人 (1件): 松田 正道
公報種別:公開公報
出願番号(国際出願番号):特願平5-202258
公開番号(公開出願番号):特開平7-057059
出願日: 1993年08月16日
公開日(公表日): 1995年03月03日
要約:
【要約】【目的】文字認識部が認識できなかった文字を認識対象文書のキーワードをもとに推定することにより、文字認識率を向上すること。【構成】文字認識部1で、文書画像10を認識して1文字に付きN個の候補文字を出力し、候補文字集合11から、単語辞書6、文法辞書7を用いて候補文節を求め、文節評価値演算部で文節の語彙的及び文法的な正しさを計算し、文節の評価値を基準として文節選択部5で文節を選択し、修正文字列14を出力する。単語キーワード抽出部23で単語キーワードを、複合語キーワード抽出部22で複合語キーワードを抽出し、キーワード部分一致検索部24で、長文字列単語辞書21、単語キーワード、複合語キーワードと候補文字集合11との部分一致を求める。候補単語付加部25は、キーワード部分一致検索部24で検索された単語を候補単語集合12に追加する。
請求項(抜粋):
文書画像を認識して1文字に付きN個の候補文字を出力する文字認識部と、その候補文字集合から単語辞書を用いて候補単語集合を求める単語検索部と、その候補単語集合から文法辞書を用いて候補文節を求める文節検索部と、その候補文節の語彙的及び文法的な正しさを計算する文節評価値演算部と、それら候補文節の評価値を基準にしてその中から文節を選択し修正文字列を出力する文節選択部と、修正された単語が誤訂正である確からしさを求める単語誤訂正度演算部と、その単語誤訂正度からリジェクト文字を決定するリジェクト文字決定部と、一定の長さ以上の文字列からなる単語だけを登録した長文字列単語辞書と、その長文字列単語辞書に存在する単語と前記候補文字集合との間で部分一致検索を行う部分一致検索部と、その部分一致した単語の中で前記リジェクト文字となっている文字を前記候補単語として候補単語集合に付加する候補単語付加部とを備えたことを特徴とする文字認識装置。

前のページに戻る