特許
J-GLOBAL ID:200903006473025020
学習装置および記録媒体
発明者:
,
出願人/特許権者:
代理人 (1件):
山本 秀策
公報種別:公開公報
出願番号(国際出願番号):特願2000-318627
公開番号(公開出願番号):特開2002-133390
出願日: 2000年10月18日
公開日(公表日): 2002年05月10日
要約:
【要約】【課題】 環境から報酬と教師信号とが与えられる場合に、その両方を有効に利用することによって、学習効率を高めることのできる学習装置を提供する。【解決手段】 入力値15に応じた出力値17を生成する学習装置260は、報酬信号に基づく第1学習を実行することにより、少なくとも1つの第1パラメータに基づいて入力値15に応じた第1出力値212を生成する第1学習部12と、教師信号に基づく第2学習を実行することにより、少なくとも1つの第2パラメータに基づいて入力値15に応じた第2出力値213を生成する第2学習部13と、第1出力値212および第2出力値213の一方を出力値17として選択的に出力する出力部14と、第1学習部12による第1学習を指定するか否か、および、第2学習部13による第2学習を指定するか否かを決定する学習指定部11とを備えている。
請求項(抜粋):
少なくとも1つのパラメータに基づいて入力値に応じた出力値を生成する学習装置であって、前記出力値に関連する評価値を示す報酬信号を前記学習装置の外部から受け取る報酬信号入力部と、前記入力値に対する前記出力値の期待値を示す教師信号を前記学習装置の外部から受け取る教師信号入力部と、前記報酬信号と前記教師信号とに基づいて、前記評価値が高くなり、かつ、前記入力値に対する前記出力値が前記期待値に近づくように、前記少なくとも1つのパラメータの値を調整する調整部とを備えている、学習装置。
IPC (2件):
FI (2件):
前のページに戻る