特許
J-GLOBAL ID:200903079108726181

データクラスタリング方法、装置およびプログラム記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 高橋 明夫 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-310117
公開番号(公開出願番号):特開平11-219374
出願日: 1998年10月30日
公開日(公表日): 1999年08月10日
要約:
【要約】【課題】データクラスタ化のための距離計算の回数を減らす【解決手段】クラスタに区分されるべき複数のパターンベクトルに対する多次元探索用の探索木を構築し、根節点以外の節点をデータ空間の部分空間に対応させる(101)。探索木の節点を順次走査して、各節点に以下の処理をする。各節点に対応する部分空間毎に、複数のクラスタを代表する複数の仮代表点の内、その部分空間内のパターンベクトルに対して最近接となる見込みのない仮代表点を判別する(200)。その後その部分空間内の各パターンベクトルに対する最近接の仮代表点を、最近接となる見込みのない仮代表点を除去した後の上記複数の仮代表点から選択する。
請求項(抜粋):
データセットに含まれた複数のデータ項目を複数のクラスタに区分するためのデータクラスタリング方法であって、装置により実行される以下のステップを有するもの。(a)複数のデータ項目の一つをそれぞれ表し、それぞれ複数の次元を有する複数のパターンベクトルの各々に対して、予め指定された複数(k)個のクラスタの一つをそれぞれ代表し、上記複数の次元を有する空間に位置する予め選択された複数(k)個の仮代表点の内、そのパターンベクトルに最も近い仮代表点を判別し、(b)各パターンベクトルを、そのパターンベクトルに対して判別された最も近い仮代表点が代表するクラスタに割り当て、(c)ステップaの実行前に、上記複数のパターンベクトルの内の少なくとも一部の複数のパターンベクトルの各々に対して、少なくとも一つの最近接となる見込みがない仮代表点が上記複数の仮代表点内にあるか否かを判別し、(d)いずれかのパターンベクトルに対して最近接となる見込みがない仮代表点があるとステップcで判断されたときには、そのパターンベクトルに対して、上記複数の仮代表点からその最近接となる見込みがない仮代表点を除去した後の残りの複数の仮代表点を使用するように、ステップaで使用する上記複数の仮代表点をパターンベクトルに応じて制限する。
FI (2件):
G06F 15/401 320 Z ,  G06F 15/401 310 D

前のページに戻る