特許
J-GLOBAL ID:200903020184529803

表認識装置

発明者:
出願人/特許権者:
代理人 (1件): 小鍜治 明 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-151846
公開番号(公開出願番号):特開平7-013999
出願日: 1993年06月23日
公開日(公表日): 1995年01月17日
要約:
【要約】【目的】 長さがしきい値より短い短罫線を罫線として正しく抽出でき、表構造を正確に認識することができる信頼性に優れた表認識装置の提供。【構成】 2値画像データ中のランの内長さが実線しきい値以上のランを実線罫線要素として抽出しこれを連結して実線罫線を抽出する実線罫線抽出部3と、ランの内特定パターンのランが破線しきい値以上の長さより続くものを破線罫線要素として抽出しこれを連結して破線罫線を抽出する破線罫線抽出部4と、実線罫線と破線罫線とで囲まれた部分をセルとして抽出して表構造を抽出する表構造抽出部5と、を備えた表認識装置であって、表構造抽出部5で抽出されたセルの内高さ,横幅がしきい値よりも小さいセルを検索する小セル検索部10と、このセル内からランを抽出して短罫線を抽出する短罫線抽出部11と、短罫線を用いて表構造を補正する表構造補正部12と、を備えた構成からなる。
請求項(抜粋):
認識対象文書から得られる2値画像データから縦・横方向のランを抽出するラン抽出部と、前記ラン抽出部で抽出されたランの内長さが実線しきい値以上のランを実線罫線要素として抽出しこの実線罫線要素を連結して実線罫線を抽出する実線罫線抽出部と、前記ラン抽出部で抽出されたランの内特定パターンのランが破線しきい値以上の長さより続くものを破線罫線要素として抽出しこの破線罫線要素を連結して破線罫線を抽出する破線罫線抽出部と、前記実線罫線抽出部で抽出された実線罫線と前記破線罫線抽出部で抽出された破線罫線とで囲まれた部分をセルとして抽出して表構造を抽出する表構造抽出部と、を備えた表認識装置であって、前記表構造抽出部で抽出されたセルの内高さ,横幅が小セルしきい値よりも小さいセルを検索する小セル検索部と、前記小セル検索部で検索された各セル内からランを抽出して長さの短い実線・破線罫線を抽出する短罫線抽出部と、前記短罫線抽出部で抽出された長さの短い実線・破線罫線を用いて前記表構造抽出部で抽出された表構造を補正する表構造補正部と、を備えたことを特徴とする表認識装置。
IPC (2件):
G06K 9/36 ,  G06K 9/62

前のページに戻る