特許
J-GLOBAL ID:201203091625754905
最適制御システム
発明者:
,
,
,
出願人/特許権者:
代理人 (1件):
特許業務法人創成国際特許事務所
公報種別:公開公報
出願番号(国際出願番号):特願2011-076025
公開番号(公開出願番号):特開2012-208902
出願日: 2011年03月30日
公開日(公表日): 2012年10月25日
要約:
【課題】制御対象の行動態様を定める最適解の探索精度向上を図ることができる最適制御システムを提供する。【解決手段】方策記憶要素120が、状態推定要素110による確率分布p(x)の今回更新結果と、行動探索要素200による条件付き確率分布p(u|x)の今回更新結果とに基づき、同時確率分布p(u,x)の今回更新結果を取得する。一方、行動探索要素200が、状態指定要素110による確率分布p(x)の今回更新結果と、方策記憶要素120による同時確率分布p(u,x)の前回更新結果とに基づき、条件付き確率分布p(u|x)の今回更新結果を取得するための今回基準となる条件付き確率分布p(u|x)を定める。【選択図】 図1
請求項(抜粋):
制御対象の最適行動を決定するための最適制御システムであって、
前記制御対象の状態xの各回の測定結果に応じて、状態xの確率分布p(x)を更新するように構成されている状態推定要素と、
前記制御対象の状態xの各回の測定結果に応じて、状態xおよび行動uの同時確率分布p(u,x)を更新するように構成されている方策記憶要素と、
条件付き確率分布p(u|x)に応じた複数の行動候補uiの生成と、当該複数の行動候補のそれぞれの評価関数f(u|x)に鑑みた適合度fiの評価と、当該評価結果に応じた行動候補の選定と、当該選定行動候補の分布特性を評価関数f(u|x)の形状特性に近似させるような条件付き確率分布p(u|x)の更新とを繰り返すことにより、条件付き確率分布p(u|x)の今回更新結果を取得するとともに、適合度に鑑みて適当な最適行動u*を前記制御対象がしたがうべき行動として決定するように構成されている行動探索要素とを備え、
前記方策記憶要素が、確率分布p(x)の今回更新結果と、前記行動探索要素による条件付き確率分布p(u|x)の今回更新結果とに基づき、同時確率分布p(u,x)の今回更新結果を取得するように構成され、
前記行動探索要素が、前記状態推定要素による確率分布p(x)の今回更新結果と、前記方策記憶要素による同時確率分布p(u,x)の前回更新結果とに基づき、条件付き確率分布p(u|x)の今回更新結果を取得するための今回基準となる条件付き確率分布p(u|x)を定めるように構成されていることを特徴とする最適制御システム。
IPC (2件):
FI (3件):
G06N3/00 550C
, G06N3/00 550E
, G05B13/02 J
Fターム (3件):
5H004GA18
, 5H004GB16
, 5H004KC01
前のページに戻る