VRL3:視覚的深層強化学習のためのデータ駆動フレームワーク【JST・京大機械翻訳】

Wang Che; Luo Xufang; Ross Keith; Li Dongsheng

プレプリント

J-GLOBAL ID：202202218076048347 整理番号：22P0292936

VRL3:視覚的深層強化学習のためのデータ駆動フレームワーク【JST・京大機械翻訳】

VRL3: A Data-Driven Framework for Visual Deep Reinforcement Learning

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2022年02月17日プレプリントサーバーでの情報更新日： 2023年03月31日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

挑戦的な視覚深層強化学習(DRL)タスクを解くための簡単な設計を有する強力なデータ駆動フレームワークであるVRL3を提案した。データ駆動手法を取り上げて多数の主要な障害を分析し,データ駆動視覚DRLに関する一連の設計原理,新しい発見,および重要な洞察を提示した。このフレームワークは,ステージ1において,タスク-診断視覚表現を学習するために,非RLデータセット(例えばImageNet)を利用する。ステージ2では,オフラインRLデータ(例えば,限られた数のエキスパート実証)を用いて,タスク-診断表現をより強力なタスク特異的表現に変換する。ステージ3では,オンラインRLでエージェントを微調整した。以前のSOTAと比較して,スパース報酬と現実的視覚入力による挑戦的な手作業タスクのセットにおいて,VRL3は平均780%のより良いサンプル効率を達成した。そして,最も硬いタスクに関して,VRL3は1220%のサンプル効率(より広い符号器を使用するとき2440%)であり,計算のわずか10%でタスクを解決する。これらの重要な結果は,データ駆動深層強化学習の大きな可能性を明確に示す。【JST・京大機械翻訳】

, ,
, , , 【Automatic Indexing@JST】

人工知能

, , ,

前のページに戻る