より安全なエージェントインセンティブのための経路特定目的【JST・京大機械翻訳】

Farquhar Sebastian; Carey Ryan; Everitt Tom

プレプリント

J-GLOBAL ID：202202219969861832 整理番号：22P0336229

より安全なエージェントインセンティブのための経路特定目的【JST・京大機械翻訳】

Path-Specific Objectives for Safer Agent Incentives

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年04月21日プレプリントサーバーでの情報更新日： 2022年04月21日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

ナイーブインセンティブが不安全である安全なエージェントを訓練するための一般的フレームワークを提示した。用例として,操作的または知覚的行動は報酬を改善することができるが,避けるべきである。ほとんどのアプローチがここで失敗した:エージェントは必要な手段によって期待されるリターンを最大にする。末端の手段として使用すべきでない状態の「デリケート」部分による設定を形式的に記述した。次に,著者らは,Causal影響Diagram解析を用いて,状態の繊細な部分によって媒介されない期待リターンに及ぼす行動の因果関係を最大にするために,エージェントを訓練する。得られたエージェントは,繊細な状態を制御する動機を持たない。さらに,このフレームワークが既存の提案を統一し,一般化する方法を示した。【JST・京大機械翻訳】

, ,

人工知能 , システム・制御理論一般

, ,

前のページに戻る