プレプリント
J-GLOBAL ID:202202208134428788   整理番号:22P0300953

可読行動のためのポリシー正則化【JST・京大機械翻訳】

Policy Regularization for Legible Behavior
著者 (2件):
資料名:
発行年: 2022年03月08日  プレプリントサーバーでの情報更新日: 2022年03月08日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習解釈は,一般的に,その決定が検査の専門家によって理解できるようなエージェント機構への洞察を提供することを意味する。しかし,この定義は,文献からの結果としての手法によって,相互作用のフルレンシーが意思決定アルゴリズムの深い検査を禁止するオンライン設定のために短くなるかもしれない。オンライン設定における解釈可能性をサポートするために,エージェントの可読性に焦点を当てた説明可能な計画文献法から,観測者モデルにおいて容易に識別できる意図を借りることが有用である。本論文で提案するように,エージェントの政策の中で可読行動を注入することは,その学習アルゴリズムの修正成分を必要としない。むしろ,エージェントの最適政策は,政策が不正確な政策を推論する観察をいかに生産するかを評価することによって,可読性のために正則化できる。定式化において,レジビリティによって導入された決定境界は,エージェントの政策が,他の政策においても高い尤度を持つ行動を返す状態に影響を与える。これらの場合,そのような行動と可読/準最適行動の間のトレードオフがなされる。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る