[25年前]【Powered by NICT】

文献

J-GLOBAL ID：201702219917785283 整理番号：17A0826309

[25年前]【Powered by NICT】

[25 Years Ago]

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A0826309&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A0826309&from=J-GLOBAL&jstjournalNo=D0895B") }}

資料名：
巻： 37 号： 2 ページ： 18-30 発行年： 2017年
JST資料番号： D0895B ISSN： 1066-033X CODEN： ISMAD7 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

強化学習は,学習制御への主要な神経回路網手法の一つである。すべく制御システム展望制御問題を二つのクラスに分けることができるから見ること1)調節と追跡問題の目的は,基準軌道を追跡することである,2)最適制御問題の目的は,参照軌道の項で定義されているとは言い切れない制御されたシステムの挙動の汎関数を極値化することである。第一種の問題のための適応法は良く知られており,自己同調レギュレータとモデル規範法を含んでいたが,最適制御問題のための適応法は相対的にほとんど注目を集めている。さらに,研究されてきた適応最適制御法は,ほとんどすべての間接法,制御は各段階で推定されたシステムモデルから再計算である。この計算は本質的に複雑であり,最適制御を直接より魅力的推定した適応方法になっている。非線形システムの適応最適制御への計算の簡単な直接アプローチとして強化学習法を取り上げた。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】

, , , , , , , ,
, , 【Automatic Indexing@JST】

システム・制御理論一般 , システム設計・解析

前のページに戻る