強化学習:ポリシー正則化によるエージェントキャラクタリゼーション【JST・京大機械翻訳】

Maree Charl; Omlin Christian

プレプリント

J-GLOBAL ID：202202217853548123 整理番号：22P0279163

強化学習:ポリシー正則化によるエージェントキャラクタリゼーション【JST・京大機械翻訳】

Reinforcement Learning Your Way: Agent Characterization through Policy Regularization

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年01月21日プレプリントサーバーでの情報更新日： 2022年01月21日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。

最先端の強化学習(RL)アルゴリズムの複雑性の増加は,説明可能性と理解を阻害する不透明性をもたらした。これは,学習された政策から情報を抽出することを目指すいくつかの事後説明可能性法の発展に繋がり,その結果,説明可能性を説明する。これらの方法は政策の経験的観察に依存し,エージェントの挙動の特性化を一般化することを目的とする。本研究では,それらの目的関数の正則化を通してエージェントの政策に特性行動を埋め込む方法を開発した。提案手法は,学習中のエージェントの挙動を誘導し,固有の特性化をもたらす。それは学習プロセスをモデル説明と接続する。著者らは,著者らの方法の実行可能性に関する形式的議論と経験的証拠を提供した。将来の研究において,著者らは,個人の個人主義に基づく個々の金融顧客の投資ポートフォリオを最適化するエージェントを開発するために,それを採用することを意図した。【JST・京大機械翻訳】

, , , , , , , , , , , , ,
, 【Automatic Indexing@JST】

人工知能

, , ,

前のページに戻る