特許
J-GLOBAL ID:201103023234331004
データ分類装置およびデータ分類方法
発明者:
出願人/特許権者:
代理人 (1件):
田川 幸一
公報種別:特許公報
出願番号(国際出願番号):特願2001-162654
公開番号(公開出願番号):特開2002-352244
特許番号:特許第4682339号
出願日: 2001年05月30日
公開日(公表日): 2002年12月06日
請求項(抜粋):
【請求項1】 複数のデータを1以上のカテゴリーに分類するためのデータ分類装置であって、
類似度の高いカテゴリー同士を順次統合して行くことにより、1個のデータのみを構成要素とする最下位のカテゴリーから全データを構成要素とする最上位のカテゴリーに至るツリー構造のカテゴリー体系を構築し、
ツリー構造のカテゴリー体系を構成する各カテゴリーについて、当該カテゴリーを構成するデータ相互の類似度に基づいて、当該カテゴリーのまとまりの良さを示す結合度を決定し、
カテゴリーの結合度が当該カテゴリーを構成する直下のいずれのカテゴリーの結合度よりも少なくとも低くないカテゴリーのうち、ツリー構造の最も上位にあるカテゴリーを最適カテゴリーとして決定し、
最適カテゴリーと当該最適カテゴリーを構成するデータとを対応付けて記憶させるデータ分類装置において、
カテゴリーGaとカテゴリーGbとを統合して得られる新たなカテゴリーをGとし、それぞれのカテゴリーの結合度をJ(Ga)、J(Gb)、J(G)とし、それぞれのカテゴリーを構成するデータの数をC(Ga)、C(Gb)、C(G)としたとき、カテゴリーGの結合度J(G)が、次式
J(G)=(J(Ga)・(C(Ga)-1)+J(Gb)・(C(Gb)-1)+β)/(C(Ga)+C(Gb)-1)
で表されることを特徴とするデータ分類装置、
ただし、カテゴリーGaを構成するC(Ga)個のデータおよびカテゴリーGbを構成するC(Gb)個のデータを、それぞれデータD1、D2、...、DmおよびデータDm+1、Dm+2、...、Dnとし、データDiのデータDjに対する類似度をAijとしたとき、上式のβは次式
で表現される。
IPC (1件):
FI (1件):
引用特許:
前のページに戻る