Pat
J-GLOBAL ID:200903079297180984
文書画像の論理構造化文書への変換方法および装置
Inventor:
Applicant, Patent owner:
Agent (1):
山本 恵一
Gazette classification:公開公報
Application number (International application number):1993023480
Publication number (International publication number):1994214983
Application date: Jan. 20, 1993
Publication date: Aug. 05, 1994
Summary:
【要約】【目的】 黒白2値画像で表現される複数の文書画像を、章・節・文章段落・図等に分けられた論理構造を持つ文書に変換する。【構成】 複数の文書画像から、互いに近接した領域を抽出し大まかなレイアウトを解析し、文書画像のヘッダ/フッタ領域を抽出しページ番号部および共通コンテント部を識別し、各ページのカラム領域の内のブロックの構築を行い、論理構造を識別するための節番号部解析を行い、各節内の表示属性の解析を行い文章の段落分けを行い、カラム/ページ末の文章段落とそれに続くカラム/ページ先頭の文章段落に注目し表示属性がほぼ等しければマージを行い文書の論理構造を完成することができる。文書画像を、論理構造を持つ文書に変換することによって、論理構造をベースとする編集や検索等の処理可能な形式とする。
Claim (excerpt):
黒白2値画像で表現される複数の文書画像を、章・節・文章段落・図等に分けられた構造を持つ論理構造化文書に変換するシステムにおいて、文書画像のカラム抽出やブロック抽出によって実現されるレイアウト解析に加え、文書画像のヘッダ/フッタ領域を抽出しページ番号部、共通コンテント部を識別し、各ページのカラム領域の確定を行いカラム内のブロックの構築を行い、論理構造を識別するための節番号部解析を行い、各節内の表示属性の解析を行い文章の段落分けを行い、カラム/ページ末の文章段落とそれに続くカラム/ページ先頭の文章段落に注目し表示属性がほぼ等しければマージを行うことによって、文書の論理構造を完成することを特徴とする文書画像の論理構造化文書への変換方法。
IPC (2):
G06F 15/20 530
, G06F 15/20 550
Return to Previous Page