Pat
J-GLOBAL ID:200903085794095087
ロボット装置およびロボット制御方法、記録媒体、並びにプログラム
Inventor:
,
,
,
Applicant, Patent owner:
Agent (1):
稲本 義雄
Gazette classification:公開公報
Application number (International application number):2002145334
Publication number (International publication number):2003340759
Application date: May. 20, 2002
Publication date: Dec. 02, 2003
Summary:
【要約】【課題】 ロボットに、ユーザを飽きさせないように行動させることができるようにする。【解決手段】 行動管理部72は、行動選択確率に基づいて、探索的行動と知識利用的行動を選択する。行動管理部72が、選択した行動aを実行すると、環境・ユーザ111から報酬rが与えられる。行動管理部72は、報酬rに基づき、行動価値を更新し、その行動価値を、ボルツマン分布に適用して、行動選択確率を決定する。また、行動管理部72は、ボルツマ温度を入力情報に基づいて変化させる。本発明は、ロボットの強化学習システムに適用できる。
Claim (excerpt):
供給される入力情報に応じた行動を行うロボット装置において、探査的行動と知識利用的行動の選択を動的に変更する行動管理手段を備えることを特徴とするロボット装置。
IPC (3):
B25J 13/00
, A63H 11/00
, B25J 5/00
FI (3):
B25J 13/00 Z
, A63H 11/00 Z
, B25J 5/00 C
F-Term (40):
2C150CA02
, 2C150DA05
, 2C150DA24
, 2C150DA25
, 2C150DA26
, 2C150DA27
, 2C150DA28
, 2C150DF03
, 2C150DF04
, 2C150DF06
, 2C150DF33
, 2C150ED10
, 2C150ED39
, 2C150ED42
, 2C150ED47
, 2C150ED52
, 2C150EF07
, 2C150EF16
, 2C150EF17
, 2C150EF22
, 2C150EF23
, 2C150EF28
, 2C150EF29
, 2C150EF33
, 2C150EF36
, 3C007AS36
, 3C007CS08
, 3C007KS23
, 3C007KS24
, 3C007KS31
, 3C007KS36
, 3C007KS39
, 3C007KT01
, 3C007LW12
, 3C007MT14
, 3C007WA04
, 3C007WA14
, 3C007WB13
, 3C007WB16
, 3C007WC00
Article cited by the Patent:
Return to Previous Page