抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
協調タスクにおける人間または超人間スキルによる協調人工知能は,機械学習研究のフロンティアに立っている。先行研究は,自己プレイ(一緒に訓練されたエージェントから成るチーム)とクロスプレイ(同じアルゴリズムを使用して訓練されたエージェントのチーム)の制約パラダイムの下で協調AI性能を評価する傾向があった。最近の研究は,これらの狭い設定のために最適化されたAIが,実世界において望ましくない協力者を作れるかもしれないことを示した。エージェント間のアルゴリズム類似性の仮定のない実験プール内の全ての他のエージェントによるチーム化性能に関して,エージェントが評価されている,協調AIを評価するための代替基準を定式化した。著者らは,既存の最先端の協調AIアルゴリズム(例えば,他のPlayおよびOff-Belief学習,このパラダイムにおけるアンダーフォーム)を示した。著者らは,ゼロショット協調(ZSC)のための多様性ベースの固有報酬のマルチエージェント拡張であるAny-Play学習増強を提案し,自己再生ベースアルゴリズムをアルゴリズム間交差プレイス設定に一般化する。著者らは,簡易行動デコーダ(SAD)にAny-Play学習増強を適用し,協調カードゲームHanbiにおける最先端の性能を示した。【JST・京大機械翻訳】