特許
J-GLOBAL ID:200903011595671814
データマイニング装置
発明者:
出願人/特許権者:
代理人 (1件):
曾我 道照 (外6名)
公報種別:公開公報
出願番号(国際出願番号):特願平9-106234
公開番号(公開出願番号):特開平10-301942
出願日: 1997年04月23日
公開日(公表日): 1998年11月13日
要約:
【要約】【課題】 利用者の対話的利用に基づいて規則性を発見するために、必要な候補の枝刈り防止と不要な候補生成の抑制という相反しがちな目標を一度に満たすことができるデータマイニング装置を得る。【解決手段】 相関ルールを生成するデータマイニングエンジン101へデータを入力する前に、前処理部102を置き、データの属性を利用者が閲覧し、対話的に操作してマイニングエンジンで処理対象となるデータの水準や属性を選択することでマイニング結果として所望の詳細度を有する規則性を生成可能とする。また、データマイニングエンジンからの出力が生成されてこれが表示される前に、後処理部103を置き、得られた規則性の取捨選択をユーザが対話的に実施し、その履歴を記憶させ次回以降は再利用することで、取捨選択が徐々に自動的に進むようにし、大量の不要の規則性生成にも対応できるようにする。
請求項(抜粋):
複数の関連するデータ項目を各レコード毎に格納してなる第1のデータベースと、各データ項目毎に階層化されて属性名と属性値を含んだデータを格納してなる第2のデータベースと、上記第1のデータベースに格納された各レコードのデータ項目及び上記第2のデータベースに格納された各データ項目毎に階層化されたデータ構造を読み込み、データ項目の選択操作入力に応じて上記第1のデータベースに格納された各レコードのデータ項目に対し上記第2のデータベースに格納された各データ項目毎に階層化されたデータ構造を参照してデータ項目を変換したレコードを出力する前処理部と、上記前処理部を介した入力される全レコードに対し同一レコード内に頻繁に出現するデータ項目をピックアップしてそれらデータ項目間で出現頻度及び信頼度の閾値を満たす相関ルールを生成してマイニング結果として出力するデータマイニングエンジンと、上記データマイニングエンジンから出力されるマイニング結果に対し取捨選択の選択操作入力に基づいて上記第2のデータベースに格納された各データ項目毎に階層化されたデータ構造を参照して削除又は優先指定に基づき並べ換えられたマイニング結果を出力する後処理部と、上記後処理部から出力されるマイニング結果を格納する第3のデータベースとを備えたデータマイニング装置。
FI (2件):
G06F 15/403 320 Z
, G06F 15/403 340 Z
前のページに戻る