プレプリント
J-GLOBAL ID:202202207963463012   整理番号:21P0036396

FISAR:深層ニューラルネットワークベース最適化によるフォワード不変安全強化学習【JST・京大機械翻訳】

FISAR: Forward Invariant Safe Reinforcement Learning with a Deep Neural Network-Based Optimize
著者 (3件):
資料名:
発行年: 2020年06月19日  プレプリントサーバーでの情報更新日: 2021年05月05日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,安全クリティカル環境において不可欠な制約による強化学習を研究した。制約違反を単調に減少させるために,Lyapunov関数として制約を取り上げ,政策パラメータ更新動力学に新しい線形制約を課した。その結果,元の安全セットは前進不変である。しかし,新しい保証可能な制約が元の政策パラメータの代わりに更新動力学に課せられるので,古典的最適化アルゴリズムはもはや適用できない。これに取り組むために,線形制約を満足しながら,目的を最適化するために,一般的な深層ニューラルネットワーク(DNN)ベースの最適化器を学習することを提案する。制約充足は,多重線形不等式制約によって定式化されたポリトープへの射影によって達成され,それは新しく設計したメトリックで解析的に解くことができる。著者らの知る限り,これはフォワード不変性保証による制約付き最適化のための最初のDNNベース最適化者である。筆者達は,制約違反を減らし,累積報酬を単調に最大化するための政策を訓練する。数値的制約付き最適化と障害物回避ナビゲーションの結果は,理論的発見を立証した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
システム設計・解析  ,  人工知能  ,  ニューロコンピュータ 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る