特許
J-GLOBAL ID:201103033387405797

連続システムをマルコフ決定過程に変換するための方法

発明者:
出願人/特許権者:
代理人 (8件): 曾我 道治 ,  鈴木 憲七 ,  梶並 順 ,  大宅 一宏 ,  上田 俊一 ,  吉田 潤一郎 ,  飯野 智史 ,  小林 健矢
公報種別:公開公報
出願番号(国際出願番号):特願2010-257949
公開番号(公開出願番号):特開2011-138489
出願日: 2010年11月18日
公開日(公表日): 2011年07月14日
要約:
【課題】最適な制御シーケンスをMDF及び連続状態空間システムについて見つけることができるように、所与の連続状態空間動的システムを離散状態空間を有するマルコフ決定過程(MDF)に変換する。【解決手段】連続動的システムが、離散状態を有するマルコフ決定過程に変換される。連続システムの所定の数の連続状態が選択される。各連続状態は、MDPの1つの離散状態に対応する。ドローネ三角形分割が連続状態に適用されて、一組の三角形が作成される。各三角形の頂点は連続状態を表す。各離散状態について、次の離散状態y=f(x,a)が求められる。xは、その離散状態に対応する連続状態を表し、aは制御動作であり、fは、連続状態の非線形遷移関数である。次の離散状態yを含む特定の三角形が識別され、次の離散状態yは、その特定の三角形の頂点によって表された連続状態xに対応する離散状態に遷移する確率として表される。【選択図】図1
請求項(抜粋):
連続システムをマルコフ決定過程(MDP)に変換するための方法であって、前記連続システムは動的であり、前記MDPは離散状態を有し、該方法は、 前記連続システムの所定の数の連続状態を選択するステップであって、各連続状態は前記MDPの1つの離散状態に対応する、選択するステップと、 ドローネ三角形分割を前記連続状態に適用するステップであって、一組の三角形を作成し、各三角形の頂点は前記連続状態を表す、適用するステップと、 を含み、 各離散状態について、 次の離散状態y=f(x,a)を求めるステップであって、xはその離散状態に対応する前記連続状態を表し、aは制御動作であり、fは前記連続状態の非線形遷移関数である、求めるステップと、 前記次の離散状態yを含む特定の三角形を識別するステップと、 前記次の離散状態yを、前記特定の三角形の前記頂点によって表された前記連続状態xに対応する前記離散状態に遷移する確率として表すステップと、 をさらに含み、 前記ステップは、プロセッサにおいて実行される、 方法。
IPC (2件):
G05B 13/02 ,  D06F 33/02
FI (2件):
G05B13/02 K ,  D06F33/02 P
Fターム (11件):
3B155AA10 ,  3B155BB02 ,  3B155KA00 ,  3B155KB25 ,  3B155LB04 ,  3B155MA05 ,  3B155MA06 ,  5H004GA30 ,  5H004GB16 ,  5H004KC10 ,  5H004KC12

前のページに戻る