特許
J-GLOBAL ID:200903087430159740

データ分類学習方法、データ分類方法、データ分類学習装置、データ分類装置、データ分類学習プログラムを記録した記録媒体、データ分類プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 金田 暢之 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-181820
公開番号(公開出願番号):特開2002-008000
出願日: 2000年06月16日
公開日(公表日): 2002年01月11日
要約:
【要約】【課題】 訓練データのみならずテストデータの分布を考慮してテストデータの分布にあった分類装置を構成し、テストデータの分類精度を上げる。【解決手段】 yiが未定義値でかつデータN Ntrain(i)が正しく学習されているテストデータiの中で最小のd(i, N Ntrain(i))を与えるテストデータiAを見つける(ステップ1)。yiが未定義値でかつデータN Ntest(i)のクラスyN Ntest(i)が未定義値でなく、かつN Ntest(i)が正しく学習されているテストデータの中で、最小のd(i, N Ntest(i))を与えるテストデータiBを見つける(ステップ3)。テストデータiAとiBで、d(iA, N Ntrain(iA))とd(iB, N Ntest(iB))を比較し小さい方のデータをiCとする(ステップ4)。yiCに最近接データのラベルを代入する(ステップ5)。ステップ1〜4を一定回数繰り返した後、最後の学習され構成されたデータ分類装置でテストデータを分類する(ステップ5)。
請求項(抜粋):
各テストデータについて、当該テストデータまでの距離が最も短い訓練データである最近接訓練データおよびその距離、および当該テストデータまでの距離が最も短い他のテストデータである最近接テストデータおよびその距離が与えられている場合に、テストデータの分類法を学習するデータ分類学習方法であって、クラスが未定義値で、かつ最近接訓練データが正しく学習されている、すなわち最近接訓練データの特徴ベクトルに対してデータ分類装置が判定し、出力する分類クラスが真の分類クラスと一致するテストデータの中で最近接訓練データとの距離が最小の第1のテストデータを求めるステップと、クラスが未定義値で、かつ最近接テストデータのクラスが未定義値でなく、かつ最近接テストデータが正しく学習されている、すなわち最近接テストデータの特徴ベクトルに対してデータ分類装置が判定し、出力する分類クラスが仮につけられた分類クラスと一致するテストデータの中で最近接テストデータとの距離が最小の第2のテストデータを求めるステップと、第1のテストデータと第2のテストデータのうち、それぞれ最近接訓練データ、最近接テストデータとの距離が小さい方のデータを第3のテストデータとするステップと、第3のテストデータのクラスに、第3のテストデータとして選択されたデータのクラスを代入するステップを有し、これらステップを一定回数繰り返し、その際第1、第2のテストデータのいずれも求まらず、したがって第3のデータが求まらなかった場合、最後のステップを行わないデータ分類学習方法。
IPC (3件):
G06N 3/00 560 ,  G06F 17/30 170 ,  G06F 17/30 210
FI (3件):
G06N 3/00 560 A ,  G06F 17/30 170 A ,  G06F 17/30 210 D
Fターム (2件):
5B075ND03 ,  5B075NR12

前のページに戻る