文献
J-GLOBAL ID:201802218273534576   整理番号:18A1909002

離散時間アフィン非線形システムのための深い強化学習ベースの有限水平最適制御【JST・京大機械翻訳】

Deep Reinforcement Learning Based Finite-Horizon Optimal Control for a Discrete-Time Affine Nonlinear System
著者 (5件):
資料名:
巻: 2018  号: SICE  ページ: 567-572  発行年: 2018年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近似動的計画法(ADP)は,離散時間Hamilton-Jacobi-Bellman(HJB)方程式に対する近似数値解を得ることを目的としている。発見的動的計画法(HDP)は,HJB方程式を2つの方程式に分離することによるADPの2段階反復方式であり,1つは値関数のためのもの,もう1つはポリシー関数のためのものであり,それらはそれぞれ臨界とアクターと呼ばれる。以前のADP実装は,機能近似器の選択によって制限されており,それは,重要な事前ドメイン知識または適合するための多数のパラメータを必要とする。しかしながら,計算機科学コミュニティによってもたらされた深い学習における最近の進歩は,事前ドメイン知識なしで高次元非線形関数を近似するための深いニューラルネットワーク(DNN)の利用を可能にする。これに動機付けられて,著者らは臨界とアクターの関数近似器としてDNNsの可能性を調べた。無限層最適制御問題とは対照的に,有限層最適制御(FHOC)問題の臨界とアクターは,時変関数であり,境界条件を満たさなければならない。DNN構造とFHOCに適した訓練アルゴリズムを提示した。実例を提供し,提案した方法の妥当性を実証した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (5件):
分類
JSTが定めた文献の分類名称とコードです
専用演算制御装置  ,  図形・画像処理一般  ,  音声処理  ,  医用画像処理  ,  符号理論 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る