可読行動のためのポリシー正則化【JST・京大機械翻訳】

Persiani Michele; Hellstrom Thomas

プレプリント

J-GLOBAL ID：202202208134428788 整理番号：22P0300953

可読行動のためのポリシー正則化【JST・京大機械翻訳】

Policy Regularization for Legible Behavior

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年03月08日プレプリントサーバーでの情報更新日： 2022年03月08日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

強化学習解釈は,一般的に,その決定が検査の専門家によって理解できるようなエージェント機構への洞察を提供することを意味する。しかし,この定義は,文献からの結果としての手法によって,相互作用のフルレンシーが意思決定アルゴリズムの深い検査を禁止するオンライン設定のために短くなるかもしれない。オンライン設定における解釈可能性をサポートするために,エージェントの可読性に焦点を当てた説明可能な計画文献法から,観測者モデルにおいて容易に識別できる意図を借りることが有用である。本論文で提案するように,エージェントの政策の中で可読行動を注入することは,その学習アルゴリズムの修正成分を必要としない。むしろ,エージェントの最適政策は,政策が不正確な政策を推論する観察をいかに生産するかを評価することによって,可読性のために正則化できる。定式化において,レジビリティによって導入された決定境界は,エージェントの政策が,他の政策においても高い尤度を持つ行動を返す状態に影響を与える。これらの場合,そのような行動と可読/準最適行動の間のトレードオフがなされる。【JST・京大機械翻訳】

, , , , , , , , , , ,
, , , , 【Automatic Indexing@JST】

人工知能

前のページに戻る