特許
J-GLOBAL ID:200903032568418004

データベース構築装置及び方法

発明者:
出願人/特許権者:
代理人 (1件): 岩橋 文雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平11-050011
公開番号(公開出願番号):特開2000-250923
出願日: 1999年02月26日
公開日(公表日): 2000年09月14日
要約:
【要約】【課題】 文書内の罫線で囲まれた複数領域から項目定義を自動的に抽出してデータベースを自動的に構築する。【解決手段】 1文書内の罫線で囲まれた文字列領域を抽出し文字列を取得する文書解析部11と、各文書において取得した文字列領域内の文字列を位置が共通の領域毎に蓄積する文字列領域蓄積手段121と、文字列領域蓄積手段121にて蓄積した共通領域毎に蓄積された複数の文字列内の共通の文字列情報を抽出して記憶する共通文字列情報記憶手段122と、共通文字列を除いた非共通文字列を取得する非共通文字列取得手段131を設け、共通文字列情報記憶手段122に記憶した文字列をデータベースの項目として設定すると共に非共通文字列取得手段131にて取得したデータを前記項目に対応するデータとして順次蓄積していく。
請求項(抜粋):
文字や罫線の位置と内容をコード化した複数の文書からデータベースを構築する装置であって、1文書内の罫線で囲まれた一つまたは複数の文字列領域を抽出する文字列領域抽出手段と、前記抽出した文字列領域内の文字列を取得する文字列領域内文字列取得手段と、各文書において取得した文字列領域内の文字列を位置が共通の領域毎に順次蓄積して記憶する文字列領域蓄積手段と、前記文字列領域蓄積手段にて蓄積した共通領域毎に蓄積された複数の文字列内の共通の文字列情報を抽出して記憶する共通文字列情報記憶手段と、前記共通文字列情報記憶手段にて記憶された共通文字列を除いた非共通文字列を取得する非共通文字列取得手段と、文字列データを日付と数値、文字列の各データ種に分類するデータ種分類手段と、前記共通文字列情報記憶手段に記憶した文字列をデータベースの項目として設定すると共に非共通文字列取得手段にて取得したデータを前記項目に対応するデータとして順次蓄積していくデータベース蓄積手段を備えたことを特徴とするデータベース構築装置。
IPC (2件):
G06F 17/30 ,  G06T 1/00
FI (2件):
G06F 15/401 330 Z ,  G06F 15/62 330 D
Fターム (7件):
5B050BA10 ,  5B050BA16 ,  5B050BA20 ,  5B050EA06 ,  5B050GA08 ,  5B075ND26 ,  5B075NK31

前のページに戻る