強化学習における転送のための自己意図的信用割当【JST・京大機械翻訳】

Ferret Johan; Marinier Raphaeel; Geist Matthieu; Pietquin Olivier

プレプリント

J-GLOBAL ID：202202220523459958 整理番号：22P0069306

強化学習における転送のための自己意図的信用割当【JST・京大機械翻訳】

Self-Attentional Credit Assignment for Transfer in Reinforcement Learning

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2019年07月18日プレプリントサーバーでの情報更新日： 2019年11月22日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。

知識を新しい環境およびタスクに転送する能力は,一般的な学習エージェントのための顕在的デサイドタである。見かけの有望性にもかかわらず,RLにおける移動は,まだ未解決で,ほとんど利用されていない研究領域である。本論文では,転送に関するブランド-新しい展望を取り上げ,信用を割当てる能力が,RLをよりサンプル効率の良いものに移動できるタスクにおける構造的不変量を明らかにすることを示唆した。著者らの主な貢献は,自己意図的アーキテクチャに基づく後方視野信用割当て機構を使用する,RLのための学習を転送する新しい方法であるSECRETである。2つの側面は,その普遍性への鍵である:それは,別々のオフライン教師つきプロセスとして信用を割り当てることを学習し,報酬関数を排他的に修正する。その結果,報酬関数を修正せず,任意のRLアルゴリズムのトップにプラグできる転送法によって補足できる。【JST・京大機械翻訳】

, , , , , , , , , ,
, , , 【Automatic Indexing@JST】

人工知能

, , , , ,

前のページに戻る