文献
J-GLOBAL ID:201802211844039947   整理番号:18A1773272

モデルを用いない微調整によるモデルベースの深部強化学習のための神経回路網動力学【JST・京大機械翻訳】

Neural Network Dynamics for Model-Based Deep Reinforcement Learning with Model-Free Fine-Tuning
著者 (4件):
資料名:
巻: 2018  号: ICRA  ページ: 7559-7566  発行年: 2018年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
モデルフリーの深い強化学習アルゴリズムは,広い範囲のロボットスキルを学習することができることが示されているが,典型的には,良好な性能を達成するために非常に多数のサンプルを必要とする。原理的には,モデルベースのアルゴリズムは,より効率的な学習を提供することができるが,深いニューラルネットワークのような表現可能な高容量モデルに拡張することは困難であることが証明されている。本研究では,ニューラルネットワークダイナミクスモデルを,モデル予測制御(MPC)と組み合わせて,モデルベースの強化学習アルゴリズムにおいて優れたサンプル複雑性を達成し,様々な複雑な移動タスクを達成する安定で妥当な歩容を生成することを実証した。さらに,モデルなし学習者を初期化するための深いニューラルネットワークダイナミクスモデルを用いて,モデルフリー手法の高いタスク固有性能とモデルベースアプローチのサンプル効率を組み合わせるために提案した。著者らは,著者らの純粋なモデルベースのアプローチが優れたサンプル効率を有する任意の軌跡に従うことができるMuJoCo移動タスクに関して経験的に実証して,著者らのハイブリッドアルゴリズムは高速ベンチマークタスクに関するモデルフリー学習を加速することができて,水泳者,cheetah,ホッパ,およびアリエージェントに関して3-5×のサンプル効率利得を達成した。ビデオは,https:/sies.google.com/view/mbmfで見つけることができた。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 

前のページに戻る