特許
J-GLOBAL ID:200903089534213537

学習システム

発明者:
出願人/特許権者:
代理人 (1件): 松本 昂
公報種別:公開公報
出願番号(国際出願番号):特願平7-232985
公開番号(公開出願番号):特開平9-081205
出願日: 1995年09月11日
公開日(公表日): 1997年03月28日
要約:
【要約】【課題】本発明は正解が判らない状態でロボットに正しい行動を高速で行わせるように学習することができる学習システムを提供することを目的とする。【解決手段】ロボットを実際に動かしてみて周囲環境を把握しながら動作できるようにする強化学習を行う学習システムにおいて、行動決定手段3で、ロボットの行動を制御する行動データAを、現在ロボットが置かれている環境の状態を示す状態データSに応じて選択する。履歴計算手段4で、1ステップ前にロボットに行動を行わせた行動データAを、ロボットの過去の行動を示す履歴データHとして出力し、状態計算手段5で、ロボットのセンサで得られた環境の観測データDと履歴データHとを合わせて前記した状態データSを求めるように構成する。
請求項(抜粋):
ロボットを実際に動かし、周囲環境を把握しながら動作できるようにする強化学習を行う学習システムにおいて、ロボットの行動を制御する行動データを、現在ロボットが置かれている環境の状態を示す状態データに応じて選択する行動決定手段と、1ステップ前にロボットに行動を行わせた該行動データを、ロボットの過去の行動を示す履歴データとして出力する履歴計算手段と、ロボットのセンサで得られた環境の観測データと該履歴データとを合わせて前記状態データを求める状態計算手段とを具備したことを特徴とする学習システム。
IPC (3件):
G05B 13/02 ,  B25J 9/10 ,  G05D 1/02
FI (4件):
G05B 13/02 L ,  B25J 9/10 Z ,  G05D 1/02 H ,  G05D 1/02 J

前のページに戻る