特許
J-GLOBAL ID:200903039017094342

ロボット装置、ロボット装置の行動学習方法、ロボット装置の行動学習プログラム、及びプログラム記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 小池 晃 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願2002-127374
公開番号(公開出願番号):特開2003-039363
出願日: 2002年04月26日
公開日(公表日): 2003年02月13日
要約:
【要約】【課題】 複雑で連続的な行動等を効率的に学習する。【解決手段】 ロボット装置では、行動決定部104で確率的に決定された行動に基づいて、行動出力部106がその行動を実行させるコマンドを出力する。所望の行動に近づくと、訓練者は、ロボット装置に2次強化因子を与え、所望の行動に近づくための標識とする。2次強化因子が検出されると、行動決定部104は、所望の行動への遷移確率を変化させる。最終的にロボット装置が所望の行動を行うと、訓練者は、ロボット装置に1次強化因子を与える。所望の行動に至る一連の行動とコマンドとを関連づける場合には、行動記憶部105から読み出された一連の行動と音声認識部107で認識されたコマンドとが、連想記憶部108にて連想記憶される。
請求項(抜粋):
動作部を制御して行動を出現させるロボット装置であって、行動の出現傾向に基づいて、一の行動を決定する行動決定手段と、上記行動決定手段が決定した行動に基づいて、上記動作部を制御して、当該決定された行動を出現させる行動出力手段と、外部情報を入力する入力手段と、上記入力手段が入力した上記外部情報から予め設定された1次強化因子を検出する1次強化因子検出手段と、上記入力手段が入力した上記外部情報から2次強化因子を検出する2次強化因子検出手段と、上記行動決定手段が決定した行動を記憶する行動記憶手段とを備え、上記行動決定手段は、上記2次強化因子が検出される毎に、当該2次強化因子が検出された行動の出現傾向を高め、上記行動記憶手段は、上記1次強化因子が検出されると、少なくとも当該1次強化因子が検出された行動を記憶することを特徴とするロボット装置。
IPC (3件):
B25J 13/00 ,  A63H 11/00 ,  B25J 5/00
FI (3件):
B25J 13/00 Z ,  A63H 11/00 Z ,  B25J 5/00 C
Fターム (33件):
2C150CA02 ,  2C150DA05 ,  2C150DA24 ,  2C150DA25 ,  2C150DA26 ,  2C150DA27 ,  2C150DA28 ,  2C150DF03 ,  2C150DF04 ,  2C150DF06 ,  2C150DF33 ,  2C150ED10 ,  2C150ED39 ,  2C150ED42 ,  2C150ED47 ,  2C150ED52 ,  2C150EF07 ,  2C150EF09 ,  2C150EF16 ,  2C150EF17 ,  2C150EF22 ,  2C150EF23 ,  2C150EF28 ,  2C150EF29 ,  2C150EF33 ,  2C150EF36 ,  3C007AS36 ,  3C007CS08 ,  3C007LW12 ,  3C007MT14 ,  3C007WA04 ,  3C007WA14 ,  3C007WB18

前のページに戻る