特許
J-GLOBAL ID:201603013218085895
ソース追跡によるデータのプロファイリング
発明者:
出願人/特許権者:
代理人 (8件):
廣田 雅紀
, 小澤 誠次
, 東海 裕作
, 松田 一弘
, 堀内 真
, 山内 正子
, 園元 修一
, 山村 昭裕
公報種別:公表公報
出願番号(国際出願番号):特願2015-537694
公開番号(公開出願番号):特表2016-502166
出願日: 2013年08月02日
公開日(公表日): 2016年01月21日
要約:
データをプロファイリングすることが、各特定の集合についての定量的情報を記憶するために、レコードの複数の集合にアクセスすることを含み、定量的情報は、特定の集合におけるレコードの少なくとも1つの選択されたフィールドについて、値カウントエントリの対応するリスト(300A〜300C)を含み、値カウントエントリの各々は、選択されたフィールドに現れる値、及びその値が現れるレコードの数のカウントを含む。2又は3以上の集合の定量的情報を処理することが、値カウントエントリの組み合わせリスト(304)を生成するために、第1の集合及び第2の集合の各々からの少なくとも1つのフィールドについて、対応するリストの値カウントエントリをマージすること(302)と、別個のフィールド値エントリのリスト(308)を生成するために、値カウントエントリの組み合わせリストの値カウントエントリを集約すること(306)とを含み、別個のフィールド値エントリは、別個の値を識別し、且つ、2又は3以上の集合の各々について別個の値が現れるレコードの数を定量化する情報を含む。
請求項(抜粋):
データ記憶システムに記憶されたデータをプロファイリングするための方法であって、
レコードの複数の集合の各々についての定量的情報を記憶するために、前記データ記憶システムに接続されたインターフェース上で、前記データ記憶システムに記憶された前記レコードの複数の集合にアクセスするステップであって、各特定の集合についての前記定量的情報が、前記特定の集合における前記レコードの少なくとも1つの選択されたフィールドについて、値カウントエントリの対応するリストを含み、各値カウントエントリが、前記選択されたフィールドに現れる値、及び前記選択されたフィールドに前記値が現れるレコードの数のカウントを含む、アクセスするステップと、
プロファイリング要約情報を生成するために、前記集合のうちの2又は3以上の集合の前記定量的情報を処理するステップと
を含み、
前記処理するステップが、
値カウントエントリの組み合わせリストを生成するために、前記2又は3以上の集合のうちの少なくとも第1の集合及び第2の集合の各々からの少なくとも1つのフィールドについて、対応するリストの前記値カウントエントリをマージするステップと、
別個のフィールド値エントリのリストを生成するために、値カウントエントリの前記組み合わせリストの値カウントエントリを集約するステップであって、前記別個のフィールド値エントリの少なくともいくつかが、前記値カウントエントリのうちの少なくとも1つからの別個の値を識別し、且つ、前記2又は3以上の集合の各々について前記別個の値が現れるレコードの数を定量化する情報を含む、集約するステップと
を含む、方法。
IPC (1件):
FI (1件):
前のページに戻る