特許
J-GLOBAL ID:200903077382990674

文字行抽出方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 中島 司朗
公報種別:公開公報
出願番号(国際出願番号):特願平8-282603
公開番号(公開出願番号):特開平10-031716
出願日: 1996年10月24日
公開日(公表日): 1998年02月03日
要約:
【要約】【課題】 文字行方向が不明で、文字の大きさやピッチ、文字行方向の異なる文字行や写真等の領域が混在する文書からの文字行抽出を可能にする。【解決手段】 文字行候補生成部4で、画像データより生成した画素連結矩形を接続し、文字行候補を生成する。文字矩形生成部5で、生成された文字行候補を非分割領域として、主方向、副方向に適宜分割して、副方向の文字行を抽出するとともに、文字行候補内で基本矩形の統合を行なうことにより文字矩形を生成する。文字行候補分割部6で、文字矩形サイズの平均値、分散値から文字行候補の構成を判定し、構成に応じて文字行候補を分割する。文字矩形接続部7で、分割された文字行候補の領域内において文字矩形を接続することにより文字行を抽出する。
請求項(抜粋):
文字行候補生成ステップと、文字矩形生成ステップと、文字行候補分割ステップと、文字矩形接続ステップとにより構成される文字行抽出方法であって、文字行候補生成ステップが、処理対象の画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出する画素連結矩形生成ステップと、前記画像データもしくは抽出された各画素連結矩形の構成から、主な文字行の方向を主方向、主方向に直交する方向を副方向として判定する文字行方向判定ステップと、各画素連結矩形を相互の位置関係に応じて主方向又は副方向に接続することにより文字行候補を生成する画素連結矩形接続ステップとからなり、文字矩形生成ステップが、文字行候補内で、各画素連結矩形の相互の位置関係から文字を構成する画素連結矩形群を抽出し、これに外接する矩形を文字矩形として生成するステップであり、文字行候補分割ステップが、文字行候補内での文字矩形群の構成に応じて、文字行候補を分割するステップであり、文字矩形接続ステップが、分割された文字行候補内で文字矩形を接続して文字行とするステップである、文字行抽出方法。

前のページに戻る