平均場ゲームのためのスケーラブルな深層強化学習アルゴリズム【JST・京大機械翻訳】

Lauriere Mathieu; Perrin Sarah; Girgin Sertan; Muller Paul; Jain Ayush; Cabannes Theophile; Piliouras Georgios; Perolat Julien; Elie Romuald; Pietquin Olivier; Geist Matthieu

プレプリント

J-GLOBAL ID：202202215504045510 整理番号：22P0308623

平均場ゲームのためのスケーラブルな深層強化学習アルゴリズム【JST・京大機械翻訳】

Scalable Deep Reinforcement Learning Algorithms for Mean Field Games

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (11件)： , , , , , , , , , ,
資料名：
発行年： 2022年03月22日プレプリントサーバーでの情報更新日： 2022年06月17日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

平均フィールドゲーム(MFG)は,戦略的エージェントの非常に大きな母集団でゲームを効率的に近似するために導入した。最近,MFGにおける学習平衡の問題は,特にモデルフリー強化学習(RL)法を用いて,運動量を獲得した。RLを用いてさらにスケールアップする一つの制限因子は,MFGを解く既存のアルゴリズムが,戦略やq値のような近似量の混合を必要とすることである。これは,良好な一般化特性,例えばニューラルネットワークを楽しむ非線形関数近似の場合,自明ではない。この欠点に対処する2つの方法を提案した。最初のものは,歴史的データの蒸留からニューラルネットワークへの混合戦略を学習し,Fictitous Playアルゴリズムに適用した。第2のものは,歴史的データや以前の推定値を記憶する必要のない正則化に基づくオンライン混合法である。それをオンラインMirror Descentを拡張するために用いた。これらの方法が,様々なMFGを解くために,深いRLアルゴリズムの使用を効率的に可能にすることを,数値的に実証した。さらに,これらの方法が文献からSotAベースラインより優れていることを示した。【JST・京大機械翻訳】

, , , , , , , , , , , ,
, , 【Automatic Indexing@JST】

人工知能 , ゲーム理論

, , ,

前のページに戻る