特許
J-GLOBAL ID:200903018673120956
文書認識装置および郵便区分機
発明者:
,
,
,
,
,
出願人/特許権者:
代理人 (1件):
小川 勝男
公報種別:公開公報
出願番号(国際出願番号):特願平10-318693
公開番号(公開出願番号):特開2000-148906
出願日: 1998年11月10日
公開日(公表日): 2000年05月30日
要約:
【要約】 (修正有)【課題】 宛名表記中に、意味の解釈に曖昧性がある文字間の空白情報や改行情報が存在する場合に、宛名情報を高精度に認識解釈する装置を提供する。【解決手段】 文字識別処理では各文字パターンを識別した結果の候補文字ラティスを出力する。幾何学的分離情報抽出手段では宛名文字列中の空白、あるいは改行の分離情報仮説を抽出して候補文字ラティスに関連付けて出力する。ワイルドカードラティス生成処理1103では任意の英数字を表わすワイルドカード記号で表現されたラティスを生成する。表記パターン照合手段では前記ワイルドカード記号で表現された丁目番地の様々な表記を単語文字列として保持する表記パターン辞書とワイルドカードラティスとを照合する。分離情報仮説が存在する特定の場所を着目した時に、分離情報が存在すると仮定した表記パターン候補、及び、分離情報が存在しないと仮定した表記パターン候補のそれぞれを生成する。
請求項(抜粋):
紙葉上に記載された宛名情報をデジタル画像データに変換し、該デジタル画像データを用いて、宛名情報に関する知識データベースに基づき宛名情報の認識を行う文書認識装置であって、前記デジタル画像データを入力し、入力された画像から文字行情報を切り出し、さらに文字情報を切り出して認識し、切り出された各文字パターンに対して認識候補文字群を出力する文字認識手段と、文字認識手段から出力された認識候補文字群と町域名情報を格納した町域名辞書と照合することにより町域名を認識すると共に、切り出された文字行の中で丁目番地、建屋番号、部屋番号が書かれていると推定される領域の先頭、もしくは末尾を検出する町域名認識手段と、前記丁目番地推定領域の先頭または末尾から未処理の各文字パターン間の相対的な幾何学的関係から、文字列同士を分離するための分離情報仮説を生成する幾何学的分離情報仮説生成手段と、前記丁目番地推定領域の先頭または末尾から未処理の各文字パターンに対応する候補文字群中の英数字を、任意の英数字を表すワイルドカード記号で置き換えた候補文字群に変換するワイルドカード変換手段と、ワイルドカード変換手段からの出力と、前記幾何学的分離情報仮説を入力して、前記ワイルドカード記号で表現した丁目番地、建屋番号、部屋番号の表記パターンを生成する際に、幾何学的分離情報仮説を表記パターンの中の分離情報として使った表記パターン仮説と、分離情報として使わない表記パターン仮説のそれぞれの仮説を生成する表記パターン仮説生成手段と、前記表記パターン仮説生成手段から出力された表記パターン仮説と、文字認識手段から出力される候補文字群とを照らし合せ、表記パターン仮説中のワイルドカード記号を元の候補文字に復元し、丁目番地、建屋番号、部屋番号の文字列候補を出力する文字列候補生成手段と、前記町域名認識手段から出力された認識結果と、前記文字列復元手段から出力された丁目番地、建屋番号、部屋番号候補とを組み合わせて住所を表わす文字列、および、それに付随する住所を表わす住所コードを生成し、その住所コードが宛先番号辞書中に存在するかどうかを判定して存在する候補を出力する宛先番号照合手段と、を有することを特徴とする文書認識装置。
IPC (5件):
G06K 9/00
, B07C 3/14
, G06K 9/62 620
, G06K 9/70
, G06K 9/72
FI (5件):
G06K 9/00 H
, B07C 3/14
, G06K 9/62 620 B
, G06K 9/70
, G06K 9/72 A
Fターム (14件):
3F079AA01
, 3F079CA02
, 3F079CB08
, 5B064AA04
, 5B064AB03
, 5B064AB13
, 5B064AB16
, 5B064AB17
, 5B064BA01
, 5B064CA08
, 5B064DA05
, 5B064DA13
, 5B064EA19
, 5B064EA20
引用特許:
審査官引用 (3件)
-
住所読取装置及び方法
公報種別:公開公報
出願番号:特願平7-053946
出願人:株式会社日立製作所
-
文書認識装置
公報種別:公開公報
出願番号:特願平7-216297
出願人:富士通株式会社
-
特開平4-098363
前のページに戻る