特許
J-GLOBAL ID:200903023612056302

属性圧縮装置および方法

発明者:
出願人/特許権者:
代理人 (1件): 宮田 金雄 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-040149
公開番号(公開出願番号):特開平11-238073
出願日: 1998年02月23日
公開日(公表日): 1999年08月31日
要約:
【要約】【課題】 各属性の属性値の種類数、分布、各属性値のとりうる型を調べた上で圧縮の必要の可否も含めて適切な圧縮を行なうことにより、2値RDBの属性の数を減らし、相関関係発見を高速にする。【解決手段】 一般RDBから相関のある属性値の組を自動的に抽出して、一般RDBの属性値を2値RDBの「該当」、「非該当」の2値とし、一般RDBのレコードの属性値を2値RDBのレコードの対応する属性の「該当」へ変換することによって、一般RDBから2値RDBへの変換を行う。各属性の多種類の属性値を、少ない種類に圧縮してから2値RDB用の属性を生成する。一般RDBの各属性について、一般RDBに記録された各属性の型の情報に加えて、この属性の属性値の種類の数を調査し、型および種類数によって、一般RDBの各属性を分類することにより、圧縮を施すかどうかを判断する。
請求項(抜粋):
RDB(Relational Data Base)中で相関のある属性値の組を自動的に抽出する相関自動発見装置に用いられ、一般RDBから2値RDBへの変換を行う属性圧縮装置において:一般RDBの各属性を読み出し、読み出したデータを属性値カウントアップテーブルに格納するデータ読出し手段と、一般RDBから読み出したレコード数をカウントするレコード数カウンタと、データ読出し手段で読み出されたデータが数値型か否かを判定し、数値型の場合には属性値の出現度数を数値型属性値カウンタに格納し、非数値型の場合には属性値の出現度数を非数値型属性値カウンタに格納し、さらに属性値の総数を属性値総数カウンタに格納する数値型判定手段と、前記数値型属性値カウンタ、非数値型属性値カウンタ、および種々の閾値が格納された閾値テーブルの各内容に基づいて属性値のデータの型を判定し、判定結果を型決定テーブルに格納する型判定手段と、型決定テーブルに格納された各型に基づいて圧縮を行い、圧縮テーブルおよび圧縮済RDBを生成する圧縮手段と、前記圧縮済RDBに基づいて、2値RDBを生成する2値RDB変換手段とを備えたことを特徴とする属性圧縮装置。
IPC (2件):
G06F 17/30 ,  G06F 9/44 550
FI (3件):
G06F 15/40 380 D ,  G06F 9/44 550 N ,  G06F 15/401 330 A
引用特許:
審査官引用 (1件)
  • データ加工システム
    公報種別:公開公報   出願番号:特願平5-327352   出願人:株式会社日立製作所

前のページに戻る