特許
J-GLOBAL ID:200903012557883189
分離文字列統合方法および装置
発明者:
出願人/特許権者:
代理人 (1件):
長澤 俊一郎 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-115133
公開番号(公開出願番号):特開2002-015283
出願日: 2001年04月13日
公開日(公表日): 2002年01月18日
要約:
【要約】【課題】 文字認識において誤認識の原因となる分離文字列を誤りなく統合し、分離文字に起因する誤認識を防止すること。【解決手段】 文書画像から文字列矩形を抽出し、文字列矩形内の分離文字列矩形を統合する。ついで、2以上の文字列矩形に分離した分離文字列を次のように統合する。文字列矩形内部の文字数が少ない文字列矩形に注目し、その文字列矩形のの上下(横書き)もしくは左右(縦書き)にある文字列を、推定文字列サイズ程度になるように仮統合する。新たに統合してできた文字矩形を文字認識し、文字認識の評価値(例えば距離値)が一定基準を満たすか否かを判定し、分離文字列の仮統合結果を検証する。
請求項(抜粋):
2以上の文字列矩形に分離した文字列矩形を統合し、正しい文字列として認識するための分離文字列の統合方法であって、文書画像から文字領域を抽出し、黒画素連結領域の外接矩形を求めて文字列矩形を抽出し、文字列矩形間の距離、文字列矩形の推定サイズに基づき統合候補の文字列矩形を求めてそれらを仮統合し、仮統合した文字列矩形に対して文字認識を行い、該文字認識結果が所定の条件を満たしたとき、上記文字列矩形の仮統合を認めることを特徴とする分離文字列の統合方法。
IPC (2件):
G06K 9/62 620
, G06K 9/34
FI (2件):
G06K 9/62 620 B
, G06K 9/34
Fターム (8件):
5B029AA01
, 5B029BB02
, 5B029CC28
, 5B029CC30
, 5B064AA01
, 5B064AB02
, 5B064CA08
, 5B064EA36
引用特許:
審査官引用 (3件)
-
画像処理方法および画像処理装置
公報種別:公開公報
出願番号:特願平7-327261
出願人:株式会社東芝
-
光学的文字読取装置
公報種別:公開公報
出願番号:特願平3-231243
出願人:株式会社東芝, 東芝コンピユータエンジニアリング株式会社
-
特開平1-169686
前のページに戻る