強化学習における一般化のための局所特徴スワッピング【JST・京大機械翻訳】

Bertoin David; Rachelson Emmanuel

プレプリント

J-GLOBAL ID：202202219529297323 整理番号：22P0331643

強化学習における一般化のための局所特徴スワッピング【JST・京大機械翻訳】

Local Feature Swapping for Generalization in Reinforcement Learning

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年04月13日プレプリントサーバーでの情報更新日： 2022年04月13日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

過去数年間,計算資源の加速と深層学習における研究は,特にコンピュータビジョンにおいて,一連のタスクにおいて著しい実際的成功をもたらした。これらの進歩に基づいて,強化学習は,視覚観察から直接決定することができるエージェントの出現と共に,リープを前進させた。これらの成功にもかかわらず,神経アーキテクチャの過剰パラメータ化は訓練中に使われるデータの記憶,従って一般化の欠如につながる。また,視覚入力に基づく強化学習エージェントは,背景要素のような無関係な視覚特徴で報酬を誤って相関させることによってこの現象に悩まされる。この問題を軽減するために,特徴マップのチャネル整合局所置換(CLOP)から成る新しい正則化技術を導入した。提案した順列は空間相関に対するロバスト性を誘導し,RLにおける過剰適合挙動を防ぐのに役立つ。OpenAI Procgenベンチマークにおいて,CLOP法により訓練されたRLエージェントは,他の最先端の正則化技法を用いて訓練されたエージェントよりも,視覚変化およびより良い一般化特性に対してロバスト性を示した。また,教師つき学習における一般的正則化技術としてCLOPの有効性を実証した。【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

人工知能

, ,

前のページに戻る