特許
J-GLOBAL ID:200903029010179495
文字認識方法
発明者:
,
出願人/特許権者:
代理人 (1件):
長澤 俊一郎 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-064972
公開番号(公開出願番号):特開2001-331764
出願日: 2001年03月08日
公開日(公表日): 2001年11月30日
要約:
【要約】【課題】 同一行内で一定の関係にある領域のセルの文字を一つの文字列として認識することにより、文字認識結果をより利便性の高いものとすること。【解決手段】 表形式文書の表構造を認識し罫線を抽出し、行中の隣接するセルを区切る罫線が点線の場合に、隣接するセルを統合して、一つのセルとし文字認識を行う。なお、隣接するセルを統合したのち、隣接したセルを区切る点線を削除して、統合したセルを文字認識したり、また、隣接するセルを統合したのち、隣接したセルを個別に文字認識し、文字認識結果を結合してもよい。また、隣接するセルのそれぞれの大きさが一定の閾値より小さく、かつ形状が相似な場合に該セルを統合することもできる。さらに、表形式文書の項目領域より下の行のセルについて、項目領域の左右の罫線間に挟まれる複数のセルを行毎に統合して文字認識を行なってもよい。
請求項(抜粋):
罫線により区切られた表形式文書中のセルに対して文字認識を行う文字認識方法であって、上記表形式文書の行中の隣接するセルを区切る罫線が点線の場合に、該隣接するセルを統合して一つのセルとして文字認識することを特徴とする文字認識方法。
IPC (3件):
G06K 9/00
, G06F 19/00 300
, G06K 9/20 340
FI (3件):
G06K 9/00 P
, G06F 19/00 300 C
, G06K 9/20 340 P
Fターム (11件):
5B029AA01
, 5B029BB02
, 5B029CC18
, 5B029CC27
, 5B029CC30
, 5B029EE12
, 5B064AA01
, 5B064AB09
, 5B064AB13
, 5B064BA01
, 5B064CA08
引用特許:
前のページに戻る