Pat
J-GLOBAL ID:200903010468053773
外れ値度計算装置及びそれに用いる確率密度推定装置並びに忘却型ヒストグラム計算装置
Inventor:
,
Applicant, Patent owner:
Agent (1):
▲柳▼川 信
Gazette classification:公開公報
Application number (International application number):1999275437
Publication number (International publication number):2001101154
Application date: Sep. 29, 1999
Publication date: Apr. 13, 2001
Summary:
【要約】【課題】 大規模なデータの集合の中から、統計的外れ値、不正なデータ、詐欺に関わるデータ等の異常なデータを、教師無しのデータから発見する。【解決手段】 一つの入力データの外れ値度は、学習した確率密度が、その入力データを取込むことによって、学習する前と比較してどれだけ変化したかという量によって計算される。これは、いままで、学習されてきた確率密度関数と傾向が大きく異なるデータは、外れ値度が大きいと考えられるからである。より具体的には、データが入力される前後の確率密度の間の距離関数を外れ値度として計算する。そこで、確率密度推定装置21により、大量データを逐次的に読込みつつ適応的に不正データの発生する確率分布を推定し、この推定確率分布に基づき各データの外れ値度を、スコア計算装置22で計算して出力する。
Claim (excerpt):
実数ベクトル値のデータ列を入力として、各データの外れ値度合いを順次検出する外れ値度計算装置に使用され、前記データ列を順次読み込みつつ該データが発生する確率分布を正規分布の有限混合分布を用いて推定する確率密度推定装置であって、有限個の正規分布密度の各々の平均パラメータと分散パラメータの値および各正規分布の重みを記憶するパラメータ記憶手段と、入力データの値に対して、前記記憶手段からパラメータの値を読み込んで、各正規分布から該入力データが発生した確からしさを計算する確からしさ計算手段と、該確からしさ計算手段から確からしさを読み込み、各正規分布の平均と分散パラメータの値および各正規分布の重みパラメータを前記パラメータ記憶手段から読み込み、新たに読み込んだデータに応じて過去のデータを忘却しつつ更新して該記憶手段の内容を書き換えるパラメータ書換え手段とを含むことを特徴とする確率密度推定装置。
IPC (5):
G06F 15/18 550
, G06F 1/02
, G06F 17/18
, G10L 15/06
, G06F101:14
FI (5):
G06F 15/18 550 A
, G06F 1/02
, G06F101:14
, G06F 15/36 Z
, G10L 3/00 521 R
F-Term (4):
5B056BB61
, 5B056BB64
, 5D015GG01
, 5D015GG04
Patent cited by the Patent:
Return to Previous Page