Regret学習をしない混合戦略の収束の不可能性について【JST・京大機械翻訳】

Muthukumar Vidya; Phade Soham; Sahai Anant

プレプリント

J-GLOBAL ID：202202208389946570 整理番号：21P0065624

Regret学習をしない混合戦略の収束の不可能性について【JST・京大機械翻訳】

On the Impossibility of Convergence of Mixed Strategies with No Regret Learning

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2020年12月03日プレプリントサーバーでの情報更新日： 2022年03月02日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

著者らは,ステージゲームが2つの競合ゲームによって任意の2である反復ゲーム設定における最適非レグレット学習戦略から生じる混合戦略の限界挙動について研究した。著者らは,それらの議論において平均ベースで単調である最適非レグレットアルゴリズムを考察した。そのようなアルゴリズムに対して,プレーヤーの限界混合戦略は,任意のNash均衡にほぼ確実に収束できないことを示した。また,この負の結果は,楽観主義および/または適応ステップサイズのOnline-Mirror-Descentのポピュラーなバリアントを含む,これらの仮定の幅広い緩和の下で保持されていることを示した。最後に,単調性仮定を除去でき,この予想に対する部分的証拠を与える。著者らの結果は,相手の混合物の使用と更新を行うための実現の間の結果におけるこの発散の根底にある重要因子として,プレーヤーの実現における固有の確率性を同定した。【JST・京大機械翻訳】

, , , ,
, , , , 【Automatic Indexing@JST】

ゲーム理論

前のページに戻る