特許
J-GLOBAL ID:200903028998249306

表認識装置

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平3-162720
公開番号(公開出願番号):特開平5-012489
出願日: 1991年07月03日
公開日(公表日): 1993年01月22日
要約:
【要約】【目的】 印刷物・文書等から読み込まれた図形データから、文字・破線・点線、線種にかかわらず表構造及びセル内の文字を正確に認識できる表認識装置の提供。【構成】 本発明では、図形データの連結黒画素の外接矩形リストを作成する黒画素ラベリング部23と、外接矩形の辺の長さから矩形内が文字であるか否かを判断する文字矩形推定部24と、文字であると推定された矩形内の黒画素を除いた部分の縮小画像を作成する縮小画像作成部25と、縮小画像の縦・横2方向の黒画素のランのうち一定長さ以上のものを抽出するラン抽出部26と、抽出されたランを連結することにより罫線を抽出する罫線抽出部27と、抽出された罫線で囲まれた矩形を検索し表のセルとして抽出する表構造抽出部28とを備えている。
請求項(抜粋):
図形データを取り込む認識指令部と、取り込んだ図形データを記憶する画像メモリと、図形データの連結黒画素の外接矩形リストを作成する黒画素ラベリング部と、外接矩形の辺の長さから矩形内が文字であるか否かを判断する文字矩形推定部と、文字であると推定された矩形内の黒画素を除いた部分の縮小画像を作成する縮小画像作成部と、縮小画像の縦・横2方向の黒画素のランのうち一定長さ以上のものを抽出するラン抽出部と、抽出されたランを連結することにより罫線を抽出する罫線抽出部と、抽出された罫線で囲まれた矩形を検索し表のセルとして抽出する表構造抽出部とを有し、図形データから線の途切れや線種によらず正確に表の構造を認識することを特徴とする表認識装置。

前のページに戻る