特許
J-GLOBAL ID:200903010468053773

外れ値度計算装置及びそれに用いる確率密度推定装置並びに忘却型ヒストグラム計算装置

発明者:
出願人/特許権者:
代理人 (1件): ▲柳▼川 信
公報種別:公開公報
出願番号(国際出願番号):特願平11-275437
公開番号(公開出願番号):特開2001-101154
出願日: 1999年09月29日
公開日(公表日): 2001年04月13日
要約:
【要約】【課題】 大規模なデータの集合の中から、統計的外れ値、不正なデータ、詐欺に関わるデータ等の異常なデータを、教師無しのデータから発見する。【解決手段】 一つの入力データの外れ値度は、学習した確率密度が、その入力データを取込むことによって、学習する前と比較してどれだけ変化したかという量によって計算される。これは、いままで、学習されてきた確率密度関数と傾向が大きく異なるデータは、外れ値度が大きいと考えられるからである。より具体的には、データが入力される前後の確率密度の間の距離関数を外れ値度として計算する。そこで、確率密度推定装置21により、大量データを逐次的に読込みつつ適応的に不正データの発生する確率分布を推定し、この推定確率分布に基づき各データの外れ値度を、スコア計算装置22で計算して出力する。
請求項(抜粋):
実数ベクトル値のデータ列を入力として、各データの外れ値度合いを順次検出する外れ値度計算装置に使用され、前記データ列を順次読み込みつつ該データが発生する確率分布を正規分布の有限混合分布を用いて推定する確率密度推定装置であって、有限個の正規分布密度の各々の平均パラメータと分散パラメータの値および各正規分布の重みを記憶するパラメータ記憶手段と、入力データの値に対して、前記記憶手段からパラメータの値を読み込んで、各正規分布から該入力データが発生した確からしさを計算する確からしさ計算手段と、該確からしさ計算手段から確からしさを読み込み、各正規分布の平均と分散パラメータの値および各正規分布の重みパラメータを前記パラメータ記憶手段から読み込み、新たに読み込んだデータに応じて過去のデータを忘却しつつ更新して該記憶手段の内容を書き換えるパラメータ書換え手段とを含むことを特徴とする確率密度推定装置。
IPC (5件):
G06F 15/18 550 ,  G06F 1/02 ,  G06F 17/18 ,  G10L 15/06 ,  G06F101:14
FI (5件):
G06F 15/18 550 A ,  G06F 1/02 ,  G06F101:14 ,  G06F 15/36 Z ,  G10L 3/00 521 R
Fターム (4件):
5B056BB61 ,  5B056BB64 ,  5D015GG01 ,  5D015GG04
引用特許:
出願人引用 (1件) 審査官引用 (1件)

前のページに戻る