特許
J-GLOBAL ID:200903055424049586

データ分類学習方法、データ分類方法、データ分類学習器、データ分類器、データ分類学習プログラムを記録した記憶媒体、データ分類プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 金田 暢之 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-327153
公開番号(公開出願番号):特開2002-133389
出願日: 2000年10月26日
公開日(公表日): 2002年05月10日
要約:
【要約】【課題】 訓練データの数が少ない場合にもテストデータに対するデータ分類の精度を向上させる。【解決手段】 分類クラスが付与されたデータの数が0または訓練データにおける正例の比率が分類クラスが付与されたテストデータ中の正例の比率を上回っていれば、分類クラスが付与されていないテストデータ中で強分類器による評価値が最大のテストデータの分類クラスに正例を代入し、上回っていなければ、分類クラスが付与されていないテストデータ中で強分類器による評価が最小のテストデータの分類クラスに負例を代入する。
請求項(抜粋):
特徴ベクトルと、該特徴ベクトルの分類クラスの組からなるm個(mは1以上の整数)の訓練データを入力するとともに、各訓練データに対する重みの初期値を与える第1のステップと、特徴ベクトルと、未だ与えられていない、該特徴ベクトルの分類クラスの組からなるn個(nは1以上の整数)のテストデータを入力するとともに、各テストデータに対する重みの初期値を与える第2のステップと、重みにしたがって訓練データを学習し、弱分類器を得る第3のステップと、パラメータを計算する第4のステップと、各データの重みを更新する第5のステップと、既に分類クラスが付与されているテストデータの数がゼロまたは訓練データ中の正例の数/訓練データの総数<U>></U>分類クラスとして正例が付与されたテストデータの数/既に分類クラスが付与されているテストデータの数のとき、分類クラス付与されていないテストデータの中で、それまで学習されている弱分類器を組み合せた強分類器による評価値が最大のテストデータに分類クラスとして正例を与えるとともに、該テストデータ以外で既に分類クラスが付与されているデータの重みを更新し、既に分類クラスが付与されているテストデータの数がゼロでなく、かつ訓練データ中の正例の数/訓練データの総数<分類クラスとして正例が付与されたテストデータの数/既に分類クラスが付与されているテストデータの数のとき、分類クラスが与えられていないテストデータの中で、それまで学習されている弱分類器を組合わせた強分類器による評価値が最小のテストデータに分類クラスとして負例を与え、該テストデータ以外で既に分類クラスが付与されているテストデータの重みを更新する第6のステップと、第3から第6のステップを一定回数繰り返した後、前記パラメータを用いて最終的な強分類器を得る第7のステップを有するデータ分類学習方法。
IPC (2件):
G06N 3/00 550 ,  G06F 17/30 210
FI (2件):
G06N 3/00 550 A ,  G06F 17/30 210 D
Fターム (2件):
5B075NR05 ,  5B075NR12

前のページに戻る