特許
J-GLOBAL ID:200903002931359221

知識発見方式

発明者:
出願人/特許権者:
代理人 (1件): 高橋 詔男 (外3名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-104760
公開番号(公開出願番号):特開2001-229026
出願日: 2000年04月06日
公開日(公表日): 2001年08月24日
要約:
【要約】【課題】 データベースから情報量の大きいデータのみ選択的にサンプリングし、効率的に知識発見を行なう汎用的な知識発見方式を提供する。【解決手段】 学習手段104は、高速メインメモリ120に格納されているデータからサンプリングによって作成した複数の部分サンプルを、入力部107を介して入力した下位学習アルゴリズムに学習させ、複数の仮説を得る。データ選択手段105は、この仮説を用いて、大容量データ格納装置130より読み出された候補データ各々の情報量を推定し、情報量の大きいデータのみを高速メインメモリ120に追加格納する。制御部106は、上記の処理を所定の回数繰りし、得られた最終仮説を格納する。そして、予測部102は入力部107へ入力されたラベル未知のデータに対し最終仮説によりラベル値を予測し、出力部101はこの予測値を出力する。
請求項(抜粋):
大容量データ格納装置に格納されたデータベースからサンプリングしたデータを計算機のメインメモリに読み込み高次知識を抽出するデータマイニングの知識発見方式において、学習アルゴリズムおよび該学習アルゴリズムに学習させるデータを入力する入力手段と、前記メインメモリに格納されているデータからサンプリングして作成した複数の部分データ集合を前記学習アルゴリズムへ訓練データとして入力して学習させ、複数の仮説を得る学習手段と、該学習手段により得られた複数の仮説を用いて前記大容量データ格納装置から読み出された複数のサンプル候補点に対する関数値の予測を行い、求めた予測値に基づき候補点の情報量を推定し、情報量の大きい候補点を1つあるいは複数選択し、前記メインメモリに追加して格納するデータ選択手段と、前記学習手段と前記データ選択手段による選択的なデータ格納および知識発見の処理を予め定めた停止条件が満たされるまで繰り返し、その結果得られた複数の仮説を最終仮説として前記メインメモリに格納させる制御手段と、前記複数の仮説間の平均または重み付き平均をもって前記入力部に入力したラベル未知のデータに対してラベル値を予測する予測手段と、を有することを特徴とする知識発見方式。
IPC (2件):
G06F 9/44 580 ,  G06N 1/00
FI (2件):
G06F 9/44 580 A ,  G06N 1/00

前のページに戻る