モデルを用いない微調整によるモデルベースの深部強化学習のための神経回路網動力学【JST・京大機械翻訳】

Nagabandi Anusha; Kahn Gregory; Fearing Ronald S.; Levine Sergey

文献

J-GLOBAL ID：201802211844039947 整理番号：18A1773272

モデルを用いない微調整によるモデルベースの深部強化学習のための神経回路網動力学【JST・京大機械翻訳】

Neural Network Dynamics for Model-Based Deep Reinforcement Learning with Model-Free Fine-Tuning

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=18A1773272&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=18A1773272&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (4件)： , , ,
資料名：
巻： 2018 号： ICRA ページ： 7559-7566 発行年： 2018年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

モデルフリーの深い強化学習アルゴリズムは,広い範囲のロボットスキルを学習することができることが示されているが,典型的には,良好な性能を達成するために非常に多数のサンプルを必要とする。原理的には,モデルベースのアルゴリズムは,より効率的な学習を提供することができるが,深いニューラルネットワークのような表現可能な高容量モデルに拡張することは困難であることが証明されている。本研究では,ニューラルネットワークダイナミクスモデルを,モデル予測制御(MPC)と組み合わせて,モデルベースの強化学習アルゴリズムにおいて優れたサンプル複雑性を達成し,様々な複雑な移動タスクを達成する安定で妥当な歩容を生成することを実証した。さらに,モデルなし学習者を初期化するための深いニューラルネットワークダイナミクスモデルを用いて,モデルフリー手法の高いタスク固有性能とモデルベースアプローチのサンプル効率を組み合わせるために提案した。著者らは,著者らの純粋なモデルベースのアプローチが優れたサンプル効率を有する任意の軌跡に従うことができるMuJoCo移動タスクに関して経験的に実証して,著者らのハイブリッドアルゴリズムは高速ベンチマークタスクに関するモデルフリー学習を加速することができて,水泳者,cheetah,ホッパ,およびアリエージェントに関して3-5×のサンプル効率利得を達成した。ビデオは,https:/sies.google.com/view/mbmfで見つけることができた。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , 【Automatic Indexing@JST】

図形・画像処理一般

, , , , , ,

前のページに戻る