特許
J-GLOBAL ID:200903079297180984

文書画像の論理構造化文書への変換方法および装置

発明者:
出願人/特許権者:
代理人 (1件): 山本 恵一
公報種別:公開公報
出願番号(国際出願番号):特願平5-023480
公開番号(公開出願番号):特開平6-214983
出願日: 1993年01月20日
公開日(公表日): 1994年08月05日
要約:
【要約】【目的】 黒白2値画像で表現される複数の文書画像を、章・節・文章段落・図等に分けられた論理構造を持つ文書に変換する。【構成】 複数の文書画像から、互いに近接した領域を抽出し大まかなレイアウトを解析し、文書画像のヘッダ/フッタ領域を抽出しページ番号部および共通コンテント部を識別し、各ページのカラム領域の内のブロックの構築を行い、論理構造を識別するための節番号部解析を行い、各節内の表示属性の解析を行い文章の段落分けを行い、カラム/ページ末の文章段落とそれに続くカラム/ページ先頭の文章段落に注目し表示属性がほぼ等しければマージを行い文書の論理構造を完成することができる。文書画像を、論理構造を持つ文書に変換することによって、論理構造をベースとする編集や検索等の処理可能な形式とする。
請求項(抜粋):
黒白2値画像で表現される複数の文書画像を、章・節・文章段落・図等に分けられた構造を持つ論理構造化文書に変換するシステムにおいて、文書画像のカラム抽出やブロック抽出によって実現されるレイアウト解析に加え、文書画像のヘッダ/フッタ領域を抽出しページ番号部、共通コンテント部を識別し、各ページのカラム領域の確定を行いカラム内のブロックの構築を行い、論理構造を識別するための節番号部解析を行い、各節内の表示属性の解析を行い文章の段落分けを行い、カラム/ページ末の文章段落とそれに続くカラム/ページ先頭の文章段落に注目し表示属性がほぼ等しければマージを行うことによって、文書の論理構造を完成することを特徴とする文書画像の論理構造化文書への変換方法。
IPC (2件):
G06F 15/20 530 ,  G06F 15/20 550

前のページに戻る