Pat
J-GLOBAL ID:201303025566281989

多次元データのための密度ベースのクラスタ化

Inventor:
Applicant, Patent owner:
Agent (2): 稲葉 良幸 ,  大貫 敏史
Gazette classification:公表公報
Application number (International application number):2012540239
Publication number (International publication number):2013511783
Application date: Nov. 23, 2010
Publication date: Apr. 04, 2013
Summary:
【課題】必要な処理時間をかなり短縮し、実用的なコンピューティングシステム上で実行できる方法を提供する。【解決手段】多次元空間内のデータ点をクラスタ化するための新規の密度ベースのクラスタ化方法を述べる。各点が、事前設定カットオフ半径または距離以内にある全ての点からなる隣接点を有する。各点は、それに隣接する点の数に基づいて密度の尺度を割り当てられる。どの隣接点よりも高い密度を有する点がクラスタの中心であり、一意のクラスタIDを割り当てられる。他のすべての点は、クラスタ中心に達するまで密度ができるだけ急速に増加するように隣接点のグラフを通る経路を辿る。このアルゴリズムの性能を、1次元、2次元、および18次元のデータ集合で実証する。【選択図】図1
Claim (excerpt):
第1のクラスタ中心を備える第1のクラスタに第1のクエリデータ点をクラスタ化する方法であって、前記第1のクエリデータ点および前記第1のクラスタ中心が、空間内の複数のデータ点から選択され、前記各データ点が密度によって特徴付けられる方法であって、 (a)前記第1のクラスタ中心に対する前記第1のクエリデータ点の第1のトレースを決定するステップを含み、ここで、前記第1のトレースが、前記複数のデータ点から選択されるn個のデータ点を含み、nが整数であり、前記決定ステップが、 (i)前記第1のクエリデータ点をx1として指定するステップと、 (ii)前記第1のトレースの残りのn-1個のデータ点を決定するステップとを含み、ここで、前記残りのn-1個のデータ点をx2・・・xnとして指定し、xnが、前記第1のクラスタ中心を表し、xj+1が、xjからカットオフ距離以内にある全てのデータ点のうち最大の密度を有し、jが、1〜n-1から選択される整数であり、方法がさらに、 (b)前記第1のクエリデータ点を前記第1のクラスタに割り当てるステップ を含む方法。
IPC (1):
G06F 17/30
FI (2):
G06F17/30 210D ,  G06F17/30 170F
Patent cited by the Patent:
Cited by applicant (2) Cited by examiner (2)
Article cited by the Patent:
Return to Previous Page