抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
著者らは,ステージゲームが2つの競合ゲームによって任意の2である反復ゲーム設定における最適非レグレット学習戦略から生じる混合戦略の限界挙動について研究した。著者らは,それらの議論において平均ベースで単調である最適非レグレットアルゴリズムを考察した。そのようなアルゴリズムに対して,プレーヤーの限界混合戦略は,任意のNash均衡にほぼ確実に収束できないことを示した。また,この負の結果は,楽観主義および/または適応ステップサイズのOnline-Mirror-Descentのポピュラーなバリアントを含む,これらの仮定の幅広い緩和の下で保持されていることを示した。最後に,単調性仮定を除去でき,この予想に対する部分的証拠を与える。著者らの結果は,相手の混合物の使用と更新を行うための実現の間の結果におけるこの発散の根底にある重要因子として,プレーヤーの実現における固有の確率性を同定した。【JST・京大機械翻訳】