特許
J-GLOBAL ID:200903085794095087
ロボット装置およびロボット制御方法、記録媒体、並びにプログラム
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願2002-145334
公開番号(公開出願番号):特開2003-340759
出願日: 2002年05月20日
公開日(公表日): 2003年12月02日
要約:
【要約】【課題】 ロボットに、ユーザを飽きさせないように行動させることができるようにする。【解決手段】 行動管理部72は、行動選択確率に基づいて、探索的行動と知識利用的行動を選択する。行動管理部72が、選択した行動aを実行すると、環境・ユーザ111から報酬rが与えられる。行動管理部72は、報酬rに基づき、行動価値を更新し、その行動価値を、ボルツマン分布に適用して、行動選択確率を決定する。また、行動管理部72は、ボルツマ温度を入力情報に基づいて変化させる。本発明は、ロボットの強化学習システムに適用できる。
請求項(抜粋):
供給される入力情報に応じた行動を行うロボット装置において、探査的行動と知識利用的行動の選択を動的に変更する行動管理手段を備えることを特徴とするロボット装置。
IPC (3件):
B25J 13/00
, A63H 11/00
, B25J 5/00
FI (3件):
B25J 13/00 Z
, A63H 11/00 Z
, B25J 5/00 C
Fターム (40件):
2C150CA02
, 2C150DA05
, 2C150DA24
, 2C150DA25
, 2C150DA26
, 2C150DA27
, 2C150DA28
, 2C150DF03
, 2C150DF04
, 2C150DF06
, 2C150DF33
, 2C150ED10
, 2C150ED39
, 2C150ED42
, 2C150ED47
, 2C150ED52
, 2C150EF07
, 2C150EF16
, 2C150EF17
, 2C150EF22
, 2C150EF23
, 2C150EF28
, 2C150EF29
, 2C150EF33
, 2C150EF36
, 3C007AS36
, 3C007CS08
, 3C007KS23
, 3C007KS24
, 3C007KS31
, 3C007KS36
, 3C007KS39
, 3C007KT01
, 3C007LW12
, 3C007MT14
, 3C007WA04
, 3C007WA14
, 3C007WB13
, 3C007WB16
, 3C007WC00
引用文献:
前のページに戻る