ゼロ和ゲームを超えた最後の反復収束について【JST・京大機械翻訳】

Anagnostides Ioannis; Panageas Ioannis; Farina Gabriele; Sandholm Tuomas

プレプリント

J-GLOBAL ID：202202212141637292 整理番号：22P0308706

ゼロ和ゲームを超えた最後の反復収束について【JST・京大機械翻訳】

On Last-Iterate Convergence Beyond Zero-Sum Games

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2022年03月22日プレプリントサーバーでの情報更新日： 2022年03月22日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

学習動力学のラストレート収束に関するほとんどの既存の結果は,2層ゼロ和ゲームに限られ,プレーヤーが追従する動力学に関する剛体仮定の下でのみ適用される。本論文では,ゲームと学習ダイナミクスのより広いファミリーに適用する新しい結果と技術を提供した。第1に,著者らは,一定合計ポリマトリックスと戦略的ゼロ和ゲームを含むゲームのクラスにおいて,楽観的ミラー降下(OMD)が,異なるアルゴリズムと予測機構を採用するときでさえ,ある特性である,2次経路長をいるった。これにより,O(1/√T)レートと最適O(1)regret限界を得ることができた。また,この解析は驚くべき特性を明らかにした:OMDはNash均衡に任意に近いか,または,アーカイイン効率のロバスト価格を凌駕する。さらに,ポテンシャルゲームに対して,OMDバリアントに対する最適O(1)レグレット限界と同様に,広いクラスの正則化器の下でのミラー降下に対するO(1/ε ̄2)反復後のε平衡への収束を確立した。また,このフレームワークは,近ポテンシャルゲームに拡張し,Fisher市場モデルにおける分散学習のための既知の解析を統一する。最後に,一般和連続ゲームにおける最適勾配降下(OGD)の収束,効率およびロバスト性を解析した。【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

ゲーム理論

, ,

前のページに戻る