抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習は,学習制御への主要な神経回路網手法の一つである。すべく制御システム展望制御問題を二つのクラスに分けることができるから見ること1)調節と追跡問題の目的は,基準軌道を追跡することである,2)最適制御問題の目的は,参照軌道の項で定義されているとは言い切れない制御されたシステムの挙動の汎関数を極値化することである。第一種の問題のための適応法は良く知られており,自己同調レギュレータとモデル規範法を含んでいたが,最適制御問題のための適応法は相対的にほとんど注目を集めている。さらに,研究されてきた適応最適制御法は,ほとんどすべての間接法,制御は各段階で推定されたシステムモデルから再計算である。この計算は本質的に複雑であり,最適制御を直接より魅力的推定した適応方法になっている。非線形システムの適応最適制御への計算の簡単な直接アプローチとして強化学習法を取り上げた。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】