Pat
J-GLOBAL ID:200903075862585475
データ分類装置、データ分類方法およびその方法をコンピュータに実行させるプログラム
Inventor:
Applicant, Patent owner:
Agent (1):
酒井 昭徳
Gazette classification:公開公報
Application number (International application number):2003139512
Publication number (International publication number):2004341959
Application date: May. 16, 2003
Publication date: Dec. 02, 2004
Summary:
【課題】訓練データの分布が均一でない場合にも精度よくデータを分類すること。【解決手段】従来技術のSVMによる分類では、正例・負例を分割する分離超平面を一律にマージンの中央とするために、訓練データの分布が均一でない場合は、当該密度が相対的に高い分類へデータが分類されやすいという問題があった。本発明では分類対象データの近傍における局所的な正例訓練データ密度・負例訓練データ密度を算出し、当該密度に応じて、具体的には訓練データ密度のより高い側へ分離超平面の位置を補正する。これにより、補正前は密度の高い分類へ分類されていたデータが、補正後は密度の低い分類へ分類される確率が高まり、訓練データ密度の相対的に低い場所で分類精度が悪化する問題を解決できる。なお、SVM以外の分類手法(kNN等)で、同様に訓練データ密度により分類の閾値を補正することも可能。【選択図】 図2
Claim (excerpt):
複数のデータの存在する空間を分離面により各分類ごとの空間に分割するデータ分類装置において、
分類対象データの位置における、第1の分類に分類される訓練データの密度を算出する第1の密度算出手段と、
前記分類対象データの位置における、第2の分類に分類される訓練データの密度を算出する第2の密度算出手段と、
前記第1の密度算出手段により算出された密度および前記第2の密度算出手段により算出された密度にもとづいて前記分離面の位置を補正する分離面位置補正手段と、
を備えたことを特徴とするデータ分類装置。
IPC (1):
FI (1):
F-Term (5):
5L096FA66
, 5L096FA69
, 5L096JA11
, 5L096KA04
, 5L096MA07
Article cited by the Patent:
Return to Previous Page