Pat
J-GLOBAL ID:200903033402703513
文書ファイリング装置
Inventor:
Applicant, Patent owner:
Agent (1):
境 廣巳
Gazette classification:公開公報
Application number (International application number):1996197031
Publication number (International publication number):1998027237
Application date: Jul. 08, 1996
Publication date: Jan. 27, 1998
Summary:
【要約】【課題】 文書ファイリング装置に於いて、文書中の文字をコード化してデータベースに蓄積しても、再利用時に元のレイアウトをほぼ再現できるようにする。【解決手段】 データ入力装置1は、文書を読み取り、そのイメージを示す文書データを出力する。レイアウト情報抽出手段2は、文書データに基づいて文書中に存在する各文字のレイアウト情報を抽出し、文字認識手段3は、各文字の文字コードを出力する。論理構造抽出手段4は、各文字の文字コード,レイアウト情報に基づいて、文書中に存在するパラグラフ,図等の論理構造単位を抽出する。構造化情報生成手段5は、各論理構造単位毎に、その論理構造単位中に存在する各文字の文字コードと、その論理構造単位の種類と、文書の再利用時にその論理構造単位のレイアウトを再現するためのレイアウト再現情報とを対応付けてデータベース6に蓄積する。
Claim (excerpt):
文書を読み取り、そのイメージを示す文書データを出力するデータ入力装置と、該データ入力装置から出力された文書データに基づいて、前記文書中の各文字のレイアウト情報を抽出するレイアウト情報抽出手段と、前記データ入力装置から出力された文書データに基づいて、前記文書中の各文字を認識し文字コードを出力する文字認識手段と、前記レイアウト情報抽出手段が抽出した各文字のレイアウト情報と前記文字認識手段から出力された文字コードとに基づいて、前記文書中に存在する、文字を構成単位とする論理構造単位を抽出すると共に、抽出した各論理構造単位の種類を特定する論理構造抽出手段と、該論理構造抽出手段で抽出された論理構造単位毎に、その論理構造単位中に存在する各文字の文字コードと、その論理構造単位の種類と、文書の再利用時にその論理構造単位のレイアウトを再現するためのレイアウト再現情報とを対応付けてデータベースに蓄積する構造化情報生成手段とを備えたことを特徴とする文書ファイリング装置。
IPC (4):
G06T 1/00
, G06F 17/21
, G06F 19/00
, G06F 17/30
FI (5):
G06F 15/62 330 D
, G06F 15/20 530 A
, G06F 15/22 C
, G06F 15/401 330 Z
, G06F 15/403 310 C
Patent cited by the Patent:
Return to Previous Page