Pat
J-GLOBAL ID:200903024718420530

2相データクラスタ方法および装置と2相データクラスタプログラムを記録した記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 三好 秀和 (外1名)
Gazette classification:公開公報
Application number (International application number):1998052340
Publication number (International publication number):1999250094
Application date: Mar. 04, 1998
Publication date: Sep. 17, 1999
Summary:
【要約】【課題】 データ空間内のデータの固まりを指定数分に集約するための初期クラスタ核の位置を決定し、データ空間内のデータを最適な集約し、大量のデータの分布傾向を容易に把握し得る2相データクラスタ方法および装置と2相データクラスタプログラムを記録した記録媒体を提供する。【解決手段】 初期クラスタ核をランダムにまたは統計的推測によりデータ空間内にユーザ指定数のK倍だけ設定し、データと初期クラスタ核をもって集約処理を行い、処理結果のクラスタ核の位置を出力し、評価関数をもって処理結果のクラスタ核から最適な集約処理をできるクラスタ核を抽出し、該クラスタ核を初期クラスタ核として設定して再度集約処理を行い、1回目の集約処理においてデータの固まりに近いクラスタ核が生成され、その中からクラスタ核を抽出し、集約処理を行う。
Claim (excerpt):
大量の件数のデータから多次元のデータ空間内の関係が近いデータを所望の集約クラスタ数に集約したクラスタを生成する2相データクラスタ方法であって、集約するクラスタ数、集約処理の重み付けをクラスタ核間距離かクラスタ内のデータの広がりの程度のどちらで行うかを0から1の範囲で指定する重み付けパラメータα、初期核クラスタ数を集約クラスタ数から決定するための初期核クラスタ数決定パラメータKを指定し、この指定された初期核クラスタ数を条件として集約処理の初期値となる初期クラスタ核を各次元の最大および最小の範囲内でランダムにまたは統計的推定により設定し、K-平均法を含むクラスタ手法を集約処理に適用し、クラスタ核と各データ間の距離を各次元について計算し、総合的に距離の近いデータを同一クラスタに集約し、クラスタ核を抽出するための指標として重み付けパラメータαを1に近付けるとクラスタ核間距離に関するウェイトが高く設定され、重み付けパラメータαを0に近付けると各クラスタ内のデータの分散割合に関する量のウェイトが高く設定されるための次に示す評価関数Ci :【数1】Ci =(重み付けパラメータα)*(クラスタ核間の距離行列に関する量)+(1-重み付けパラメータα)*(クラスタ核iに集約された各データとクラスタ核との距離に関する量)の値が低い順に初期クラスタ核を並べ、上位から指定した集約クラスタ核の数だけを再集約処理のための初期クラスタ核として抽出し、この抽出されたクラスタ核を再集約処理の初期クラスタ核として使用して集約処理を行い、ユーザの指定した数のクラスタを生成することを特徴とする2相データクラスタ方法。
IPC (2):
G06F 17/30 ,  G06F 17/18
FI (3):
G06F 15/401 310 D ,  G06F 15/36 Z ,  G06F 15/403 380 Z

Return to Previous Page