Pat
J-GLOBAL ID:200903070716354621

学習システム

Inventor:
Applicant, Patent owner:
Agent (1): 工藤 実
Gazette classification:公開公報
Application number (International application number):2009170637
Publication number (International publication number):2009301557
Application date: Jul. 21, 2009
Publication date: Dec. 24, 2009
Summary:
【課題】選択的にサンプリングして効率的に学習する方式を提供する。【解決手段】入力装置1により、ラベルが設定された学習データと終了条件とを入力する。学習部21は、学習アルゴリズムを用いて、仮説を生成する。記憶部33には、そのラベルが設定されていない複数の候補データが格納されている。データ選択部23は、記憶部を参照し、仮説を用いて、複数の候補データの各々に対するスコアを計算し、計算されたスコアに基づいて、候補データの中から第1候補データを選択する。データ更新部24は、ユーザにより決定されたラベルを上記選択された第1候補データに設定し、選択された第1候補データを学習データに付加して学習部に出力する。データ選択処理とデータ更新処理と学習処理とを終了条件を満たすまで繰り返す。終了条件が満たされたとき、制御部22は、学習部により生成された仮説を最終仮説として出力装置4に出力する。【選択図】図2
Claim (excerpt):
コンピュータプログラムが格納された記憶部と、 前記コンピュータプログラムを実行する処理装置と、 出力装置と を具備し、 前記処理装置は、 1つ以上のデータの特徴を示す属性である入力とクラスである出力との組で表現され、且つ、その出力の具体的な値を示すラベルが設定された学習データと、終了条件とを入力する(a)処理を実行し、 前記学習データに対して、入力に対する出力値を表す決定木を、予め定めた決定木生成アルゴリズムを用いて生成し、決定木のそれぞれの葉に対してその葉に該当した前記選択データのうちで予め定めたクラスであるデータ数の割合(葉に該当し予め定めたクラスである前記選択データ数/葉に該当した前記選択データ数)、あるいは、その割合をなました値((葉に該当し予め定めたクラスである前記選択データ数+1)/(葉に該当した前記選択データ数+2)など)を葉の値として計算し、データに対する出力値をそのデータが該当した葉の値とした仮説を生成する(b)処理を実行し、 前記記憶部には、更に、そのラベルが設定されたデータである複数の候補データが格納され、 前記処理装置は、 前記記憶部に格納された前記複数の候補データそれぞれのデータの入力に対し、葉の値という出力値をそれぞれのデータに対するスコアとして計算し、スコアから選択確率を計算するような予め定めた関数を用いて、前記複数の候補データの中から、選択候補データを選択する(c)処理を実行し、 前記選択候補データを前記学習データに付加して前記(b)処理を実行する(d)処理を実行し、 前記終了条件が満たされないとき、前記(c)、(d)処理を実行する(e)処理を実行し、 前記終了条件が満たされたとき、前記(d)処理により生成された前記仮説を前記出力装置に出力する(g)処理を実行する 知識発見システム。
IPC (1):
G06N 5/04
FI (2):
G06N5/04 580A ,  G06N5/04 550J
Patent cited by the Patent:
Cited by applicant (3) Cited by examiner (3)

Return to Previous Page