Any-Play:ゼロショット協調のための固有増強【JST・京大機械翻訳】

Lucas Keane; Allen Ross E.

プレプリント

J-GLOBAL ID：202202220770151575 整理番号：22P0281596

Any-Play:ゼロショット協調のための固有増強【JST・京大機械翻訳】

Any-Play: An Intrinsic Augmentation for Zero-Shot Coordination

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年01月28日プレプリントサーバーでの情報更新日： 2022年01月28日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

協調タスクにおける人間または超人間スキルによる協調人工知能は,機械学習研究のフロンティアに立っている。先行研究は,自己プレイ(一緒に訓練されたエージェントから成るチーム)とクロスプレイ(同じアルゴリズムを使用して訓練されたエージェントのチーム)の制約パラダイムの下で協調AI性能を評価する傾向があった。最近の研究は,これらの狭い設定のために最適化されたAIが,実世界において望ましくない協力者を作れるかもしれないことを示した。エージェント間のアルゴリズム類似性の仮定のない実験プール内の全ての他のエージェントによるチーム化性能に関して,エージェントが評価されている,協調AIを評価するための代替基準を定式化した。著者らは,既存の最先端の協調AIアルゴリズム(例えば,他のPlayおよびOff-Belief学習,このパラダイムにおけるアンダーフォーム)を示した。著者らは,ゼロショット協調(ZSC)のための多様性ベースの固有報酬のマルチエージェント拡張であるAny-Play学習増強を提案し,自己再生ベースアルゴリズムをアルゴリズム間交差プレイス設定に一般化する。著者らは,簡易行動デコーダ(SAD)にAny-Play学習増強を適用し,協調カードゲームHanbiにおける最先端の性能を示した。【JST・京大機械翻訳】

, , , , , , , , , , , , ,
, , 【Automatic Indexing@JST】

人工知能

, , ,

前のページに戻る