抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習解釈は,一般的に,その決定が検査の専門家によって理解できるようなエージェント機構への洞察を提供することを意味する。しかし,この定義は,文献からの結果としての手法によって,相互作用のフルレンシーが意思決定アルゴリズムの深い検査を禁止するオンライン設定のために短くなるかもしれない。オンライン設定における解釈可能性をサポートするために,エージェントの可読性に焦点を当てた説明可能な計画文献法から,観測者モデルにおいて容易に識別できる意図を借りることが有用である。本論文で提案するように,エージェントの政策の中で可読行動を注入することは,その学習アルゴリズムの修正成分を必要としない。むしろ,エージェントの最適政策は,政策が不正確な政策を推論する観察をいかに生産するかを評価することによって,可読性のために正則化できる。定式化において,レジビリティによって導入された決定境界は,エージェントの政策が,他の政策においても高い尤度を持つ行動を返す状態に影響を与える。これらの場合,そのような行動と可読/準最適行動の間のトレードオフがなされる。【JST・京大機械翻訳】