ロボット装置、ロボット装置の行動学習方法、ロボット装置の行動学習プログラム、及びプログラム記録媒体

Inventor： , ,
Applicant, Patent owner： ,
Agent (1)：小池晃 (外2名)
Gazette classification：公開公報
Application number (International application number)：2002127374
Publication number (International publication number)：2003039363
Application date： Apr. 26, 2002
Publication date： Feb. 13, 2003
Summary：

【要約】【課題】複雑で連続的な行動等を効率的に学習する。【解決手段】ロボット装置では、行動決定部104で確率的に決定された行動に基づいて、行動出力部106がその行動を実行させるコマンドを出力する。所望の行動に近づくと、訓練者は、ロボット装置に2次強化因子を与え、所望の行動に近づくための標識とする。2次強化因子が検出されると、行動決定部104は、所望の行動への遷移確率を変化させる。最終的にロボット装置が所望の行動を行うと、訓練者は、ロボット装置に1次強化因子を与える。所望の行動に至る一連の行動とコマンドとを関連づける場合には、行動記憶部105から読み出された一連の行動と音声認識部107で認識されたコマンドとが、連想記憶部108にて連想記憶される。

Claim (excerpt)：

動作部を制御して行動を出現させるロボット装置であって、行動の出現傾向に基づいて、一の行動を決定する行動決定手段と、上記行動決定手段が決定した行動に基づいて、上記動作部を制御して、当該決定された行動を出現させる行動出力手段と、外部情報を入力する入力手段と、上記入力手段が入力した上記外部情報から予め設定された1次強化因子を検出する1次強化因子検出手段と、上記入力手段が入力した上記外部情報から2次強化因子を検出する2次強化因子検出手段と、上記行動決定手段が決定した行動を記憶する行動記憶手段とを備え、上記行動決定手段は、上記2次強化因子が検出される毎に、当該2次強化因子が検出された行動の出現傾向を高め、上記行動記憶手段は、上記1次強化因子が検出されると、少なくとも当該1次強化因子が検出された行動を記憶することを特徴とするロボット装置。

IPC (3)：

B25J 13/00 , A63H 11/00 , B25J 5/00

FI (3)：

B25J 13/00 Z , A63H 11/00 Z , B25J 5/00 C

F-Term (33)：

2C150CA02 , 2C150DA05 , 2C150DA24 , 2C150DA25 , 2C150DA26 , 2C150DA27 , 2C150DA28 , 2C150DF03 , 2C150DF04 , 2C150DF06 , 2C150DF33 , 2C150ED10 , 2C150ED39 , 2C150ED42 , 2C150ED47 , 2C150ED52 , 2C150EF07 , 2C150EF09 , 2C150EF16 , 2C150EF17 , 2C150EF22 , 2C150EF23 , 2C150EF28 , 2C150EF29 , 2C150EF33 , 2C150EF36 , 3C007AS36 , 3C007CS08 , 3C007LW12 , 3C007MT14 , 3C007WA04 , 3C007WA14 , 3C007WB18

Return to Previous Page