Pat
J-GLOBAL ID:200903006473025020

学習装置および記録媒体

Inventor:
Applicant, Patent owner:
Agent (1): 山本 秀策
Gazette classification:公開公報
Application number (International application number):2000318627
Publication number (International publication number):2002133390
Application date: Oct. 18, 2000
Publication date: May. 10, 2002
Summary:
【要約】【課題】 環境から報酬と教師信号とが与えられる場合に、その両方を有効に利用することによって、学習効率を高めることのできる学習装置を提供する。【解決手段】 入力値15に応じた出力値17を生成する学習装置260は、報酬信号に基づく第1学習を実行することにより、少なくとも1つの第1パラメータに基づいて入力値15に応じた第1出力値212を生成する第1学習部12と、教師信号に基づく第2学習を実行することにより、少なくとも1つの第2パラメータに基づいて入力値15に応じた第2出力値213を生成する第2学習部13と、第1出力値212および第2出力値213の一方を出力値17として選択的に出力する出力部14と、第1学習部12による第1学習を指定するか否か、および、第2学習部13による第2学習を指定するか否かを決定する学習指定部11とを備えている。
Claim (excerpt):
少なくとも1つのパラメータに基づいて入力値に応じた出力値を生成する学習装置であって、前記出力値に関連する評価値を示す報酬信号を前記学習装置の外部から受け取る報酬信号入力部と、前記入力値に対する前記出力値の期待値を示す教師信号を前記学習装置の外部から受け取る教師信号入力部と、前記報酬信号と前記教師信号とに基づいて、前記評価値が高くなり、かつ、前記入力値に対する前記出力値が前記期待値に近づくように、前記少なくとも1つのパラメータの値を調整する調整部とを備えている、学習装置。
IPC (2):
G06N 3/02 ,  G06N 3/08
FI (2):
G06N 3/02 ,  G06N 3/08

Return to Previous Page