文献
J-GLOBAL ID:201702237260472077   整理番号:17A0881427

モデルフリーとモデルベースのベンチマーキング最適制御【Powered by NICT】

Benchmarking model-free and model-based optimal control
著者 (9件):
資料名:
巻: 92  ページ: 81-90  発行年: 2017年 
JST資料番号: C0133C  ISSN: 0921-8890  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
モデルフリー強化学習と非線形モデル予測制御は,規定されたコスト関数による最適な方法で動的システムを制御するための二つの異なる手法である。強化学習は,このシステムを用いて探索的相互作用を介して制御ポリシーを獲得するが,非線形モデル予測制御は,システムの明示的に与えられた数学モデルを利用した。本論文では,理想的な系と同様にパラメータ的および構造的不確実性を持つシステムのための強化学習と非線形モデル予測制御の性能の包括的な比較を提供する。比較を二種類の判定基準,すなわち軌跡と得られた報酬の類似性に基づいている。両方法の評価は,標準的ベンチマーク問題を対象とした:倒立振り子のスイングアップとバランス課題。を最初に適切な数学的定式化を見出し,問題の定式化の違いの影響を検討した。,不確実性に対する強化学習と非線形モデル予測制御のロバスト性を調べた。結果は,不確実性はシステムパラメータの同定を通して除去することができるかどうかを非線形モデル予測制御は,強化学習を超える利点を持つことを示した。はモデル無し強化学習は,不正確なモデルを用いた非線形モデル予測制御よりも優れた性能を損益分岐点が存在する。これらの知見は,利点は,このような不確実性を受ける実システムのためのこれらの方法を組み合わせることによって得ることができることを示唆した。将来では,ハイブリッド制御器を開発し,実際の七自由度歩行ロボットに対するその性能を評価するために計画している。Copyright 2017 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
ロボットの運動・制御 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る