特許
J-GLOBAL ID:201203067089775068

帳票認識装置、方法およびプログラム

発明者:
出願人/特許権者:
代理人 (1件): 大菅 義之
公報種別:公開公報
出願番号(国際出願番号):特願2010-292253
公開番号(公開出願番号):特開2012-141670
出願日: 2010年12月28日
公開日(公表日): 2012年07月26日
要約:
【課題】不特定多数の種類の帳票を、予め定義されたフォームを用いずに認識する装置において、文字認識制度を劣化させることなく、二値化処理を高速化する。【解決手段】罫線で区切られたセルの中に文字若しくは文字列を含む、又は含まないセルで構成される表を含む帳票に記載されている文字を認識する帳票認識装置であって、前記表のセルの配置を定める表構造を画定し、画像から予め定められた文字又は文字列である見出しを抽出し、前記見出しを含むセルである見出しセルの位置を前記表構造中に特定して、画定された前記表構造のセルのうち、セル内に何らかの文字又は文字列が記入されている記入済みセルを検出し、検出された前記記入済みセルのみを二値化対象セルとして選択する。前記表の中の前記二値化対象セルの二値化処理を行ない二値画像を生成することにより、前記二値画像から帳票に記載されている文字を認識する。【選択図】図1
請求項(抜粋):
罫線で区切られたセルであって、その中に文字若しくは文字列を含む、又は含まないセルで構成される表を含む帳票に記載されている文字を認識する帳票認識装置であって、 前記表において、前記セルの配置を定める表構造を画定する表構造画定手段と、 前記画像から予め定められた文字又は文字列である見出しを抽出する、見出し抽出手段と、 前記見出しを含むセルである見出しセルの位置を前記表構造中に特定する、見出し位置特定手段と、 前記表構造画定手段で画定された前記表構造のセルのうち、セル内に何らかの文字又は文字列が記入されている記入済みセルを検出する記入済みセル検出手段と、 前記記入済みセル検出手段で検出された前記記入済みセルのみを二値化対象セルとして選択する二値化対象セル選択手段と、 前記表の中の前記二値化対象セルの二値化処理を行ない、二値画像を生成する二値化手段と、 前記二値画像から帳票に記載されている文字を認識する文字認識手段、 を具備することを特徴とする帳票認識装置。
IPC (3件):
G06K 9/20 ,  G06T 7/40 ,  G06T 7/60
FI (4件):
G06K9/20 340K ,  G06K9/20 340L ,  G06T7/40 100B ,  G06T7/60 200K
Fターム (17件):
5B029AA01 ,  5B029AA02 ,  5B029BB02 ,  5B029CC21 ,  5B029CC26 ,  5B029CC27 ,  5B029CC28 ,  5B029CC29 ,  5B029DD04 ,  5B029EE12 ,  5L096AA02 ,  5L096BA17 ,  5L096EA43 ,  5L096FA03 ,  5L096FA44 ,  5L096FA59 ,  5L096FA73
引用特許:
審査官引用 (3件)

前のページに戻る