オフライン2層ゼロ和Markovゲームはいつ可解か?【JST・京大機械翻訳】

Cui Qiwen; Du Simon S.

プレプリント

J-GLOBAL ID：202202207459972216 整理番号：22P0025759

オフライン2層ゼロ和Markovゲームはいつ可解か?【JST・京大機械翻訳】

When is Offline Two-Player Zero-Sum Markov Game Solvable?

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年01月10日プレプリントサーバーでの情報更新日： 2022年10月14日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

どのデータセット仮定がオフライン2層ゼロ和Markovゲームを解くかを調べた。オフライン単一エージェントMarkov決定プロセスに対する恒星コントラストにおいて,単一戦略濃度仮定は,オフライン2層ゼロ和MarkovゲームにおけるNash均衡(NE)戦略の学習には不十分であることを示した。他方,著者らは,片側濃度と呼ぶ新しい仮定を提案し,この仮定の下で証明可能な効率的型アルゴリズムを設計した。さらに,NE戦略の学習には片側濃度仮定が必要であることを示した。さらに,提案アルゴリズムは,2つの広く研究されている設定,即ち,均一濃度推定とターンベースMarkovゲームを持つデータセットに対して修正なしに,ミニマックスサンプル複雑性を達成できる。本研究は,オフラインマルチエージェント強化学習の理解に向けた重要な初期段階として役立つ。【JST・京大機械翻訳】

, , , , , , ,
, , , 【Automatic Indexing@JST】

ゲーム理論 , 人工知能

, , ,

前のページに戻る