プレプリント
J-GLOBAL ID:202202218076048347   整理番号:22P0292936

VRL3:視覚的深層強化学習のためのデータ駆動フレームワーク【JST・京大機械翻訳】

VRL3: A Data-Driven Framework for Visual Deep Reinforcement Learning
著者 (4件):
資料名:
発行年: 2022年02月17日  プレプリントサーバーでの情報更新日: 2023年03月31日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
挑戦的な視覚深層強化学習(DRL)タスクを解くための簡単な設計を有する強力なデータ駆動フレームワークであるVRL3を提案した。データ駆動手法を取り上げて多数の主要な障害を分析し,データ駆動視覚DRLに関する一連の設計原理,新しい発見,および重要な洞察を提示した。このフレームワークは,ステージ1において,タスク-診断視覚表現を学習するために,非RLデータセット(例えばImageNet)を利用する。ステージ2では,オフラインRLデータ(例えば,限られた数のエキスパート実証)を用いて,タスク-診断表現をより強力なタスク特異的表現に変換する。ステージ3では,オンラインRLでエージェントを微調整した。以前のSOTAと比較して,スパース報酬と現実的視覚入力による挑戦的な手作業タスクのセットにおいて,VRL3は平均780%のより良いサンプル効率を達成した。そして,最も硬いタスクに関して,VRL3は1220%のサンプル効率(より広い符号器を使用するとき2440%)であり,計算のわずか10%でタスクを解決する。これらの重要な結果は,データ駆動深層強化学習の大きな可能性を明確に示す。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る