特許
J-GLOBAL ID:201203019853371940

文書認識装置、文書認識方法、プログラム及び記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 井上 誠一
公報種別:公開公報
出願番号(国際出願番号):特願2011-077222
公開番号(公開出願番号):特開2012-212293
出願日: 2011年03月31日
公開日(公表日): 2012年11月01日
要約:
【課題】ルビ文字の対象となる親文字を正しく特定する。また、ルビ文字の認識結果にルビ種別情報を付加する。【解決手段】レイアウト解析手段22は、入力画像に対してレイアウト解析処理を行って文章領域を抽出する。領域分別手段23は、文章領域に対して領域分別処理を行い、本文行領域と行間領域とに分別する。仮決定手段24は、行間文字列を抽出し、行間文字列ごとに、本文行領域の文字列の中から仮親文字列を決定するとともに、仮ルビ種別を決定する。文字認識手段25は、文字認識処理を行う。本決定手段26は、仮親文字列の認識結果を参照キーとしてフリガナ辞書31を参照することによって得られるルビ候補の少なくとも1つと、行間文字列の認識結果が一致するか否かの判定であるルビ一致判定を行い、仮親文字列を本親文字列として決定する、或いは、仮親文字列に含まれる一部の文字列を除いた残りの文字列を本親文字列として決定する。【選択図】図2
請求項(抜粋):
ルビを含む文書の画像を入力画像とし、前記文書を認識する文書認識装置であって、 親文字に対するルビ候補を示すルビ辞書を記憶するルビ辞書記憶手段と、 前記入力画像の文章領域を、本文行領域と行間領域とに分別する領域分別手段と、 前記行間領域の文字列である行間文字列を抽出し、前記行間文字列ごとに、前記本文行領域の文字列の中から、仮決定の親文字列である仮親文字列を決定する仮決定手段と、 前記本文行領域及び前記行間領域の文字を認識する文字認識手段と、 前記文字認識手段による前記仮親文字列の認識結果を参照キーとして前記ルビ辞書を参照することによって得られる前記ルビ候補の少なくとも1つと、前記文字認識手段による前記行間文字列の認識結果が一致するか否かの判定であるルビ一致判定を行い、前記ルビ一致判定の結果に基づいて、前記仮親文字列を本決定の親文字列である本親文字列として決定する、或いは、前記仮親文字列に含まれる一部の文字を除いた残りの文字列を前記本親文字列として決定する本決定手段と、 を具備する文書認識装置。
IPC (2件):
G06K 9/03 ,  G06F 17/22
FI (2件):
G06K9/03 D ,  G06F17/22 512R
Fターム (5件):
5B064AA01 ,  5B064AB02 ,  5B064BA01 ,  5B064EA23 ,  5B109MJ04
引用特許:
審査官引用 (3件)

前のページに戻る