特許
J-GLOBAL ID:200903094064726307

データベース自動作成装置

発明者:
出願人/特許権者:
代理人 (1件): 森田 寛 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平5-299269
公開番号(公開出願番号):特開平7-152780
出願日: 1993年11月30日
公開日(公表日): 1995年06月16日
要約:
【要約】【目的】電子化された文書から指定された情報を抽出し加工して,データベースを作成するデータベース自動作成装置に関し,所定のデータベースの仕様に応じた情報を自動的に生成し,目的に応じたデータベースを容易に構築できるようにすることを目的とする。【構成】予め定義した抽出パターンと電子化文書とを照合して得た抽出パターンの各項に対応する文字列を,データベースの各項目と抽出パターンの各項との対応関係や変換形式を指定したテーブル4を参照して,データベースの仕様に応じた文字列に変換する。その結果を目的とするデータベース装置に登録する。
請求項(抜粋):
あらかじめ定めたデータベースの各項目の内容を複数の文書から抽出して,データベースの自動作成を行う装置において,文書を読み込む文書入力手段と,任意の終端記号列と一致可能なことを表すワイルドカード項,終端記号列で定義される一般項,あらかじめ定義したサブパターンをサブパターン名で代表させるサブパターン項,指定されたパターンが省略可能であることを表す省略項または複数のパターンの選言で表現された選言項の少なくともいずれかを含む項の連糸接続の記述に基づく抽出パターンおよび前記サブパターン名に定義されたサブパターンを入力する抽出パターン入力手段と,前記文書入力手段に読み込まれた文書の各々の文と,前記抽出パターン入力手段に入力された抽出パターンとの照合を行って,照合に成功した場合には,抽出パターンおよびサブパターンの各々の項に対応する文字列を得る抽出パターン照合手段と,文字列をあらかじめ定められた規則やテーブルに従って他の文字列に変換する複数の文字列変換手段と,データベースの各項目ごとに,対応する抽出パターンの項および起動すべき文字列変換手段を指定したデータベース変換テーブルと,前記抽出パターン照合手段で得られた結果から,前記データベース変換テーブルで指定された抽出パターンの項に対応する文字列を,データベースの項目に対応する内容として取り出す項目内容文字列抽出手段と,前記項目内容文字列抽出手段で得られた文字列を,前記データベース変換テーブルに指定された前記文字列変換手段の一つを起動することによって変換した文字列を得る登録情報生成手段と,前記登録情報生成手段で得られた情報を指定されたデータベースに登録するデータベース登録手段とを備えることを特徴とするデータベース自動作成装置。
FI (2件):
G06F 15/403 350 C ,  G06F 15/40 370 A

前のページに戻る