文献
J-GLOBAL ID:201802249662065170   整理番号:18A0161049

多重モデル離散時間システムの最適制御のためのActor-Criticオフポリシー学習【Powered by NICT】

Actor-Critic Off-Policy Learning for Optimal Control of Multiple-Model Discrete-Time Systems
著者 (4件):
資料名:
巻: 48  号:ページ: 29-40  発行年: 2018年 
JST資料番号: W0791A  ISSN: 2168-2267  CODEN: ITCEB8  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,ヒト神経認知実験に動機付けられて,多重モデル線形離散時間システムの最適トラッキング制御を解決するために開発されたモデルフリーポリシー外強化学習アルゴリズム。最初に,適応自己組織化マップニューラルネットワークを用いた測定データからのシステム挙動を決定し,システム可能な挙動の各々に責任信号を帰属した。システム挙動の急激な変化は,測定データから検出され,挙動は以前に検出されていない場合,新しいモデルを加えた。価値関数は部分的に重み付き価値関数により表現される。オフポリシー反復アルゴリズムは,システム動力学または基準軌道動力学についての知識なしに解を見出すために多重モデル学習に一般化した。挙動政策を実行から得られた経験の流れは異なる学習政策逐次的に対応するいくつかの価値関数を更新するために再利用するためのポリシー外手法は調整のデータ効率と速度を増加させるのに役立つ。二つの数値事例をポリシー外アルゴリズム性能の実証として役立つ。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  システム・制御理論一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る