文献
J-GLOBAL ID:201702283363799711   整理番号:17A1251780

政策反復法を用いた割引最適制御問題のためのQ関数の誤差限界解析【Powered by NICT】

Error Bound Analysis of $Q$ -Function for Discounted Optimal Control Problems With Policy Iteration
著者 (4件):
資料名:
巻: 47  号:ページ: 1207-1216  発行年: 2017年 
JST資料番号: C0425D  ISSN: 2168-2216  CODEN: ITSMFE  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,未知の離散時間非線形系の近似最適制御問題を解くための行動依存型適応動的計画法のためのQ関数の誤差限界解析を提示した。理想条件下で政策反復アルゴリズムによって導出されたQ関数の収束を示した。政策評価段階と政策改善段階におけるQ関数と制御政策の近似誤差を考慮して,各反復において近似Q関数の誤差限界を確立した。与えられた有界性条件では,近似Q関数は最適Q関数の有限近傍に収束する。提示したアルゴリズムを実行するために,2つの3層ニューラルネットワークは,Q関数および制御ポリシーを近似するために用いた。最後に,を用いて提示したアルゴリズムの妥当性を検証するためにシミュレーション例。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
システム・制御理論一般  ,  人工知能 

前のページに戻る