特許
J-GLOBAL ID:200903045736443855

文書解析装置

発明者:
出願人/特許権者:
代理人 (1件): 佐藤 隆久
公報種別:公開公報
出願番号(国際出願番号):特願平7-057229
公開番号(公開出願番号):特開平8-255220
出願日: 1995年03月16日
公開日(公表日): 1996年10月01日
要約:
【要約】【目的】紙面上の文書データを構成する文章、図形、写真などの各要素間の連続関係を抽出する文書解析装置を提供する。【構成】要素分類部110で、入力文書の各要素を、文章要素と、文章の特定部分に関わる文章付随図形要素と、文書全体に関わる独立図形要素とに分類し、文章付随図形要素は文章要素の関係箇所に連続すると判定される。独立図形要素は、隣接要素検出部120で、その各要素の位置情報に基づいて各要素間の隣接関係が検出される。その隣接する要素の中から、要素統合部130で、その隣接する複数要素が紙面上に占める領域の形状に基づいて、連続性の高い要素が抽出される。論理構造構築部140で、前記文章要素と文章付随要素の連続性と、前記独立図形要素の連続性を合わせられ、入力文章に対する論理的連続性として出力される。
請求項(抜粋):
文字・図形などの視覚的に認識可能な情報が略矩形のブロックごとに2次元面上に適宜配置された文書データより、前記各ブロック間の論理的連続関係を抽出する文書解析装置であって、前記各ブロックの位置情報に基づいて、各ブロック間の隣接関係を検出する隣接関係検出手段と、前記検出された隣接する複数ブロックが、前記2次元面上に占める領域の形状に基づいて、該隣接するブロック間の論理的連続性を判定する連続性判定手段とを有する文書解析装置。
IPC (3件):
G06K 9/20 340 ,  G06K 9/20 ,  G06T 7/00
FI (3件):
G06K 9/20 340 L ,  G06K 9/20 340 C ,  G06F 15/70 330 Q

前のページに戻る