抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
学習動力学のラストレート収束に関するほとんどの既存の結果は,2層ゼロ和ゲームに限られ,プレーヤーが追従する動力学に関する剛体仮定の下でのみ適用される。本論文では,ゲームと学習ダイナミクスのより広いファミリーに適用する新しい結果と技術を提供した。第1に,著者らは,一定合計ポリマトリックスと戦略的ゼロ和ゲームを含むゲームのクラスにおいて,楽観的ミラー降下(OMD)が,異なるアルゴリズムと予測機構を採用するときでさえ,ある特性である,2次経路長をいるった。これにより,O(1/√T)レートと最適O(1)regret限界を得ることができた。また,この解析は驚くべき特性を明らかにした:OMDはNash均衡に任意に近いか,または,アーカイイン効率のロバスト価格を凌駕する。さらに,ポテンシャルゲームに対して,OMDバリアントに対する最適O(1)レグレット限界と同様に,広いクラスの正則化器の下でのミラー降下に対するO(1/ε ̄2)反復後のε平衡への収束を確立した。また,このフレームワークは,近ポテンシャルゲームに拡張し,Fisher市場モデルにおける分散学習のための既知の解析を統一する。最後に,一般和連続ゲームにおける最適勾配降下(OGD)の収束,効率およびロバスト性を解析した。【JST・京大機械翻訳】