特許
J-GLOBAL ID:200903050748952058
マルチエージェントモデルを用いて経験強化型強化学習法と環境同定型強化学習法を統合する分散強化学習法
発明者:
,
出願人/特許権者:
代理人 (1件):
三好 秀和 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願平10-192101
公開番号(公開出願番号):特開2000-020494
出願日: 1998年07月07日
公開日(公表日): 2000年01月21日
要約:
【要約】【課題】 経験強化型強化学習法と環境同定型強化学習法を統合して、学習に要する試行回数が少なく、動的な環境の変化に対してロバスト性があり、最適な学習効果が得られるマルチエージェントモデルを用いて経験強化型強化学習法と環境同定型強化学習法を統合する分散強化学習法を提供する。【解決手段】 経験強化型強化学習法と環境同定型強化学習法を統合して、学習に要する試行回数が少なく、動的な環境の変化に対してロバスト性がある経験強化型強化学習法の特徴と最適に近い学習効果が得られる環境同定型強化学習法の特徴を具備している。
請求項(抜粋):
規模が大きく動的に変化する環境下で動作する自律移動ロボットおよびインタフェースエージェントを含む自律行動主体が環境に自律的に適用するために行う強化学習に対してマルチエージェントモデルを用いて経験強化型強化学習法と環境同定型強化学習法を統合することを特徴とする分散強化学習法。
IPC (2件):
G06F 15/18 510
, G06F 9/44 552
FI (2件):
G06F 15/18 510
, G06F 9/44 552
前のページに戻る