特許
J-GLOBAL ID:200903046209306927

大規模データベース内の順次パターンをマイニングするためのシステムおよび方法

発明者:
出願人/特許権者:
代理人 (1件): 合田 潔 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平8-038077
公開番号(公開出願番号):特開平8-263346
出願日: 1996年02月26日
公開日(公表日): 1996年10月11日
要約:
【要約】【課題】 大規模データベースを迅速にマイニングするためのシステムおよび方法を提供する。【解決手段】 データベースをマイニングするためのシステムおよび方法は、データベースに格納され、ユーザ定義の規則正しさでデータベース内で回帰するトランザクション・シーケンスのパターンを識別する、コンピュータが実施するプログラムを含む。本発明はまず、どのシーケンスが大規模か、すなわち、定義された規則正しさでどれが回帰するかを識別し、次に、どのシーケンスが最大か、すなわち、どの大規模シーケンスが他の大規模シーケンスのサブセットではないかを判定する。最大大規模シーケンスのセットがユーザに返され、長期間にわたる購入パターンの回帰を示す。
請求項(抜粋):
ディジタル処理装置によって読取り可能なプログラム記憶装置と、データベースに格納されたトランザクション・シーケンス内の順次パターンを識別するための方法ステップを実行するために上記プログラム記憶装置上で具体的に実施され、上記ディジタル処理装置によって実行可能な複数の命令を有するプログラムとを含み、それぞれのシーケンスが1つまたは複数の品目セットにより特徴づけられる時間的に区切られた複数のトランザクションを含むコンピュータ・プログラム・プロダクトにおいて、上記方法ステップが、(a)ある品目セットがデータベース内に存在する回数が所定の最小サポート値を超えたときにその品目セットを1組の大規模品目セットに入力するステップと、(b)トランザクションが上記1組の大規模品目セットの品目セットを含まないときにそのトランザクションを破棄し、トランザクション・シーケンス(「シーケンス」)が上記1組の大規模品目セットの品目セットを含まないときにそのシーケンスを破棄することによって、トランザクション・シーケンスの変形セットを生成するステップと、(c)大規模シーケンスの順方向セットを定義し、その大規模シーケンスの順方向セット内のシーケンスを所定の連結様式に従って連結して、次の候補大規模シーケンスのセットを生成するステップと、(d)上記次の候補大規模シーケンスのセット内の各シーケンスを上記シーケンスの変形セット内のシーケンスと比較して、その候補大規模シーケンスが該シーケンスの変形セット内に存在する回数を判定するステップと、(e)上記候補大規模シーケンスが上記シーケンスの変形セット内に存在する回数が上記最小サポート値を上回るときに該候補大規模シーケンスを次の大規模シーケンスの順方向セットに入力するステップと、(f)長期間にわたる特定のトランザクション・シーケンスを識別するための最大大規模シーケンスのセットを出力するステップとを含むことを特徴とする、コンピュータ・プログラム・プロダクト。
IPC (2件):
G06F 12/00 518 ,  G06F 17/30
FI (2件):
G06F 12/00 518 A ,  G06F 15/40 370 Z

前のページに戻る