特許
J-GLOBAL ID:200903074477581918

大量情報のクラスタリング方法

発明者:
出願人/特許権者:
代理人 (1件): 山本 恵一
公報種別:公開公報
出願番号(国際出願番号):特願平10-291376
公開番号(公開出願番号):特開2000-112917
出願日: 1998年09月30日
公開日(公表日): 2000年04月21日
要約:
【要約】【課題】 従来の近似クラスタリングよりも類似精度が高く且つ高速にクラスタを生成することができる大量情報のクラスタリング方法を提供する。【解決手段】 文書集合をベイジアンクラスタリングする手法の計算量を削減するため、部分クラスタをMDL基準で評価し、準最適なクラスタを遺伝的アルゴリズムによって決定するものである。特に、複数の情報の中からクラスタの葉ノードとなる所定の個数の情報を選択する葉ノード情報選択段階において、1つの前記情報を1つの遺伝子に対応させ、遺伝的アルゴリズムを用いて複数の情報の中からクラスタの葉ノードとなる所定の個数の情報を選択する段階を有する。また、葉ノード情報選択段階は、遺伝的アルゴリズムの中で類似度が求められた情報の対とその類似度とをデータベースに格納するものである。
請求項(抜粋):
複数の情報の中からクラスタの葉ノードとなる所定個数の情報を選択する葉ノード情報選択段階と、次に、選択されなかった残りの情報を類似する該葉ノードに割り当てる部分クラスタ生成段階と、該葉ノード情報選択段階及び該クラスタ生成段階が該生成されたクラスタの葉ノードの方向に向かって繰り返されるように指示する再帰クラスタリング段階とを有する大量情報のクラスタリング方法において、前記葉ノード情報選択段階は、1つの前記情報を1つの遺伝子に対応させ、遺伝的アルゴリズムを用いて前記複数の情報の中からクラスタの葉ノードとなる所定の個数の情報を選択することを特徴とする方法。
IPC (3件):
G06F 15/18 560 ,  G06F 15/18 550 ,  G06F 17/30
FI (3件):
G06F 15/18 560 A ,  G06F 15/18 550 C ,  G06F 15/401 310 D
Fターム (3件):
5B075NR03 ,  5B075NR12 ,  5B075UU06

前のページに戻る