特許
J-GLOBAL ID:200903076539863640

文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置

発明者:
出願人/特許権者:
代理人 (1件): 酒井 宏明
公報種別:公開公報
出願番号(国際出願番号):特願2003-357941
公開番号(公開出願番号):特開2005-122543
出願日: 2003年10月17日
公開日(公表日): 2005年05月12日
要約:
【課題】電子文書の文書レイアウト構造を精度よく抽出すること。【解決手段】文書画像中の各文字の座標情報を取得し、取得した座標情報に基づいて文書画像中の文字列を検出し、検出された文字列に含まれる文字を1つずつ選択し、その文字列を囲む外接矩形の所定の角を一角とし、かつ、選択された文字を囲む外接矩形を含む矩形検査領域内に、当該文字の番号よりも順序が後ろの番号の文字が含まれないように各文字に番号を付与し、付与された番号順に各文字を1つずつ追加して文字列を設定し、その文字列にすでに追加されている文字と新たに追加した文字とを含む矩形検査領域内にその文字列にすでに追加されている文字および新たに追加した文字以外の文字が含まれた場合に、新たに追加した文字を除外するとともにすでに追加されている文字を連結して1つの文字列として再設定する。【選択図】 図1
請求項(抜粋):
文書画像から文字列のレイアウトに係る情報を取得する文書レイアウト解析プログラムであって、 前記文書画像中の各文字に係る情報を取得し、取得した各文字に係る情報に基づいて該文書画像中の文字列を検出する文字列検出手順と、 前記文字列検出手順により検出した文字列に対し文字列レイアウト解析をおこなう文字列レイアウト解析手順と、 前記文字列レイアウト解析手順による解析結果に基づき、文字列レイアウトを再設定することにより文字列レイアウトを補正するレイアウト補正手順と、 をコンピュータに実行させることを特徴とする文書レイアウト解析プログラム。
IPC (3件):
G06K9/20 ,  G06F17/21 ,  G06T11/60
FI (3件):
G06K9/20 340K ,  G06F17/21 530A ,  G06T11/60 100A
Fターム (7件):
5B009NA01 ,  5B029AA01 ,  5B029BB02 ,  5B029CC28 ,  5B029EE08 ,  5B050BA20 ,  5B050EA05
引用特許:
出願人引用 (1件)
  • 文字認識装置
    公報種別:公開公報   出願番号:特願平5-030995   出願人:松下電器産業株式会社
審査官引用 (1件)

前のページに戻る