特許
J-GLOBAL ID:200903033402703513

文書ファイリング装置

発明者:
出願人/特許権者:
代理人 (1件): 境 廣巳
公報種別:公開公報
出願番号(国際出願番号):特願平8-197031
公開番号(公開出願番号):特開平10-027237
出願日: 1996年07月08日
公開日(公表日): 1998年01月27日
要約:
【要約】【課題】 文書ファイリング装置に於いて、文書中の文字をコード化してデータベースに蓄積しても、再利用時に元のレイアウトをほぼ再現できるようにする。【解決手段】 データ入力装置1は、文書を読み取り、そのイメージを示す文書データを出力する。レイアウト情報抽出手段2は、文書データに基づいて文書中に存在する各文字のレイアウト情報を抽出し、文字認識手段3は、各文字の文字コードを出力する。論理構造抽出手段4は、各文字の文字コード,レイアウト情報に基づいて、文書中に存在するパラグラフ,図等の論理構造単位を抽出する。構造化情報生成手段5は、各論理構造単位毎に、その論理構造単位中に存在する各文字の文字コードと、その論理構造単位の種類と、文書の再利用時にその論理構造単位のレイアウトを再現するためのレイアウト再現情報とを対応付けてデータベース6に蓄積する。
請求項(抜粋):
文書を読み取り、そのイメージを示す文書データを出力するデータ入力装置と、該データ入力装置から出力された文書データに基づいて、前記文書中の各文字のレイアウト情報を抽出するレイアウト情報抽出手段と、前記データ入力装置から出力された文書データに基づいて、前記文書中の各文字を認識し文字コードを出力する文字認識手段と、前記レイアウト情報抽出手段が抽出した各文字のレイアウト情報と前記文字認識手段から出力された文字コードとに基づいて、前記文書中に存在する、文字を構成単位とする論理構造単位を抽出すると共に、抽出した各論理構造単位の種類を特定する論理構造抽出手段と、該論理構造抽出手段で抽出された論理構造単位毎に、その論理構造単位中に存在する各文字の文字コードと、その論理構造単位の種類と、文書の再利用時にその論理構造単位のレイアウトを再現するためのレイアウト再現情報とを対応付けてデータベースに蓄積する構造化情報生成手段とを備えたことを特徴とする文書ファイリング装置。
IPC (4件):
G06T 1/00 ,  G06F 17/21 ,  G06F 19/00 ,  G06F 17/30
FI (5件):
G06F 15/62 330 D ,  G06F 15/20 530 A ,  G06F 15/22 C ,  G06F 15/401 330 Z ,  G06F 15/403 310 C
引用特許:
審査官引用 (2件)

前のページに戻る