Pat
J-GLOBAL ID:201103033387405797

連続システムをマルコフ決定過程に変換するための方法

Inventor:
Applicant, Patent owner:
Agent (8): 曾我 道治 ,  鈴木 憲七 ,  梶並 順 ,  大宅 一宏 ,  上田 俊一 ,  吉田 潤一郎 ,  飯野 智史 ,  小林 健矢
Gazette classification:公開公報
Application number (International application number):2010257949
Publication number (International publication number):2011138489
Application date: Nov. 18, 2010
Publication date: Jul. 14, 2011
Summary:
【課題】最適な制御シーケンスをMDF及び連続状態空間システムについて見つけることができるように、所与の連続状態空間動的システムを離散状態空間を有するマルコフ決定過程(MDF)に変換する。【解決手段】連続動的システムが、離散状態を有するマルコフ決定過程に変換される。連続システムの所定の数の連続状態が選択される。各連続状態は、MDPの1つの離散状態に対応する。ドローネ三角形分割が連続状態に適用されて、一組の三角形が作成される。各三角形の頂点は連続状態を表す。各離散状態について、次の離散状態y=f(x,a)が求められる。xは、その離散状態に対応する連続状態を表し、aは制御動作であり、fは、連続状態の非線形遷移関数である。次の離散状態yを含む特定の三角形が識別され、次の離散状態yは、その特定の三角形の頂点によって表された連続状態xに対応する離散状態に遷移する確率として表される。【選択図】図1
Claim (excerpt):
連続システムをマルコフ決定過程(MDP)に変換するための方法であって、前記連続システムは動的であり、前記MDPは離散状態を有し、該方法は、 前記連続システムの所定の数の連続状態を選択するステップであって、各連続状態は前記MDPの1つの離散状態に対応する、選択するステップと、 ドローネ三角形分割を前記連続状態に適用するステップであって、一組の三角形を作成し、各三角形の頂点は前記連続状態を表す、適用するステップと、 を含み、 各離散状態について、 次の離散状態y=f(x,a)を求めるステップであって、xはその離散状態に対応する前記連続状態を表し、aは制御動作であり、fは前記連続状態の非線形遷移関数である、求めるステップと、 前記次の離散状態yを含む特定の三角形を識別するステップと、 前記次の離散状態yを、前記特定の三角形の前記頂点によって表された前記連続状態xに対応する前記離散状態に遷移する確率として表すステップと、 をさらに含み、 前記ステップは、プロセッサにおいて実行される、 方法。
IPC (2):
G05B 13/02 ,  D06F 33/02
FI (2):
G05B13/02 K ,  D06F33/02 P
F-Term (11):
3B155AA10 ,  3B155BB02 ,  3B155KA00 ,  3B155KB25 ,  3B155LB04 ,  3B155MA05 ,  3B155MA06 ,  5H004GA30 ,  5H004GB16 ,  5H004KC10 ,  5H004KC12
Patent cited by the Patent:
Cited by applicant (1)

Return to Previous Page