特許
J-GLOBAL ID:200903006390792410
マルチモジュール型強化学習方法及び装置と、マルチモジュール型強化学習処理用プログラム及びそのプログラムの記録媒体
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
岡田 光由 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-170406
公開番号(公開出願番号):特開2002-099891
出願日: 2001年06月06日
公開日(公表日): 2002年04月05日
要約:
【要約】【課題】本発明は、最適なモジュールを自動的に構築できるようにすることで、マルチモジュール型強化学習を高精度かつ効率的に実行できるようにする新たなマルチモジュール型強化学習方法の提供を目的とする。【解決手段】特徴量とイベントとのマトリックスとして定義される全体状況に含まれる部分状況を順次選択し、規定の評価関数に従って、その部分状況の規則性を評価することで、再利用性の高い複数の部分状況を特定する第1の処理過程と、第1の処理過程で特定された部分状況に対応付けて、強化学習に用いる複数のモジュールを生成する第2の処理過程と、第2の処理過程で生成された複数のモジュールを使って強化学習を行う第3の処理過程とを備えるように構成する。
請求項(抜粋):
複数のモジュールを使って強化学習を行うマルチモジュール型強化学習方法において、特徴量とイベントとのマトリックスとして定義される全体状況に含まれる部分状況を順次選択し、規定の評価関数に従って、その部分状況の規則性を評価することで、再利用性の高い複数の部分状況を特定する過程と、その特定された部分状況に対応付けて、強化学習に用いる複数のモジュールを生成する過程と、その生成された複数のモジュールを使って強化学習を行う過程とを備えることを、特徴とするマルチモジュール型強化学習方法。
IPC (2件):
G06N 3/00 550
, G05B 13/02
FI (3件):
G06N 3/00 550 E
, G05B 13/02 J
, G05B 13/02 L
Fターム (9件):
5H004GB16
, 5H004HA07
, 5H004HB07
, 5H004JB08
, 5H004KC02
, 5H004KC08
, 5H004KC28
, 5H004KD42
, 5H004KD62
前のページに戻る