特許
J-GLOBAL ID:200903075615464010

データクラスター/サブクラスターの視覚化用データ分解/リダクション方法

発明者:
出願人/特許権者:
代理人 (1件): 三宅 正夫 (外1名)
公報種別:公表公報
出願番号(国際出願番号):特願2000-570715
公開番号(公開出願番号):特表2002-525719
出願日: 1999年09月17日
公開日(公表日): 2002年08月13日
要約:
【要約】【課題】高次元の多変数データが、データセットの潜在的構造の視覚的な調査を可能とするために、高次元の多変数データが2次元または3次元の投影空間に簡約化するという全ての応用への有用性をもっているデータクラスター/サブクラスターの視覚化用データ分解/リダクション方法である。【解決手段】より高次元のデータが、完全なデータセットが、より深いレベルでのクラスターおよびサグクラスターに関して、包括的な階層内で視覚化されるように、階層的視覚化を受け入れている。そのデータセットは、通常の有限正規混合モデルおよび確率的主成分投影を受入れている。そのパラメータは、赤池の情報量規準(AIC)および最小記述長(MDL)基準の下で期待値最大化法および主成分分析法を用いて計算されている。その高次元の生データは、第1のレベルにおいてデータの主要な分布を顕在化するために主成分分析法を用いて処理を受け入れている。その後、処理された情報はさらに、その主要な情報は、さらに主要なクラスター内でサブクラスターを顕在化するためにさらに処理される。種々のクラスターおよびサブクラスターが種々の階層レベルにおいて、潜在的な構造を顕在化するために視覚可能な投影を受け入れるように構成する。
請求項(抜粋):
データセットの視覚化の階層性を提供するために少なくとも3より大きな次元を各々もつ多数のデータ点からなるデータセットを、最高レベルの視覚化およびその最高レベルで視覚化されたものの少なくとも1つのクラスターKを与える少なくとも1つの第2レベルの視覚化を有した少なくとも2次元の空間へ提供するために処理する方法であって、 最高レベルの視覚化として、少なくとも主軸に沿って全データセットの簡約化された次元投影を、少なくとも2次元視覚化空間に提供する工程であって、2次元視覚化空間でその投影データセットの次元は、そのデータセットの主成分分析によって簡約化されて主成分投影軸を得たものであり、 実視のクラスターの中心に相当する上記最初に述べた視覚化空間における少なくとも1点を選択する工程と、 第2のレベルへの投影のための最適な数の可能なモデルへ展開する工程と、 最適な数の局所的なクラスターKを決定するために、赤池の情報量規準および最小記述長を交互に計算し、赤池の情報量規準および最小記述長を使用することによって第2のレベルの投影にとって最適な数の局所的クラスターkを決定する工程と、 決定された所的クラスターのための視覚化サブ空間用の主軸を決定し、最初に述べた視覚化空間と異なるある視覚化空間で決定された局所的クラスターの少なくとも1つにそのデータを投影する工程とを有する処理方法。
IPC (4件):
G06F 17/30 220 ,  G06F 17/30 360 ,  G06F 17/18 ,  G06T 7/00 250
FI (4件):
G06F 17/30 220 Z ,  G06F 17/30 360 Z ,  G06F 17/18 Z ,  G06T 7/00 250
Fターム (9件):
5B056BB61 ,  5B056BB66 ,  5B075ND06 ,  5B075PQ02 ,  5B075PQ13 ,  5L096DA04 ,  5L096EA27 ,  5L096FA38 ,  5L096FA62

前のページに戻る