特許
J-GLOBAL ID:200903021250476739

文書画像の領域抽出方法

発明者:
出願人/特許権者:
代理人 (1件): 柿本 恭成
公報種別:公開公報
出願番号(国際出願番号):特願平3-195437
公開番号(公開出願番号):特開平5-040848
出願日: 1991年08月05日
公開日(公表日): 1993年02月19日
要約:
【要約】【目的】 文字領域を大きな領域として表現することにより、文書の構成や、文章のつながり等を容易に知ることができ、効率よく文字認識が行える。【構成】 領域画像作成処理1により領域画像を作成し、その領域画像を用いてラベル画像作成処理2によってラベル画像を作成する。文字画像作成処理3では、ラベル画像において文字領域以外の領域を白にし、文字のみの文字画像を作成する。そして、統合閾値設定処理4では、文字画像を走査して最長白ラン幅のヒストグラムを作成し、統合閾値を設定する。領域抽出処理5では、横もしくは縦方向の領域分割が1回終了した時点で設定された前記統合閾値により統合を行い、前回切り出された領域数と今回切り出された領域数が等しければ領域抽出を終了し、等しくなければ処理を続ける。
請求項(抜粋):
全面黒の領域画像と原画像から文書画像の構成要素を黒画素連結領域として表現した領域画像を作成する領域画像作成処理と、前記領域画像の構成要素に一意に番号を与えたラベル画像を作成するラベル画像作成処理とを施し、前記ラベル画像を用いて前記文書画像の領域抽出を行う文書画像の領域抽出方法において、前記ラベル画像から文字領域以外の領域を全て白にした文字画像を作成する文字画像作成処理と、前記文字画像を横及び縦方向に全面走査して最長白ランを抽出し、該最長白ランの変化から白ラン幅のヒストグラムを作成し、該ヒストグラムにおいて最大頻度を与える白ラン幅を検出した後、該白ラン幅を統合閾値として決定する統合閾値設定処理と、前記文字画像内における外接矩形の内部を横方向に走査して黒画素が1つも存在しない白ラインで挟まれた第1の黒ブロックを抽出する横分割処理と、該外接矩形の内部を縦方向に走査して黒画素が1つも存在しない白ラインで挟まれた第2の黒ブロックを抽出する縦分割処理とを複数回行い、抽出された第1及び第2の黒ブロックの間隔と前記統合閾値とを比較して該第1,第2の黒ブロックの間隔が前記統合閾値よりも狭ければ統合処理を行い、該第1と第2の黒ブロックの数が等しくなった時点で抽出処理を終了する領域抽出処理とを、実行して前記文書画像の領域抽出を行うことを特徴とする文書画像の領域抽出方法。
IPC (2件):
G06K 9/20 340 ,  H04N 1/40

前のページに戻る