クールノー競争におけるマルチエージェント強化学習に関する研究

豊島健太郎; 坂本充生; 阿部拳之; 岩崎敦

文献

J-GLOBAL ID：202202230485171259 整理番号：22A0754452

クールノー競争におけるマルチエージェント強化学習に関する研究

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=22A0754452&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=22A0754452&from=J-GLOBAL&jstjournalNo=S0731A") }}

著者 (4件)： , , ,
資料名：
巻： 84th 号： 2 ページ： 2.11-2.12 発行年： 2022年02月17日
JST資料番号： S0731A 資料種別：会議録 (C)
記事区分：短報発行国：日本 (JPN) 言語：日本語 (JA)

・本研究では,クールノーゲーム(CNG)において,個々のエージェントが強化学習アルゴリズムに従った場合どのような振る舞いをするかを分析。
・市場を支配する企業が2社の寡占市場で同質材の供給量を決定するようなクールノー競争のモデルを考え,計算実験の結果エージェントは非協力的な戦略を学習すること判明。
・例えば行列数15のCNGでNeuRMDの獲得報酬をQ-学習と比較した結果,平均報酬値は時間減衰するQ-学習に比べ,前者は非協力的な方策を学習すること判明。

, , , , , ,
,

人工知能

引用文献 (4件)：

E. Calvano, G. Calzolari, V. Denicoló, and S. Pastorello. Algorithmic collusion with imperfect monitoring. International Journal of Industrial Organization, 2021. To appear.
ヨンジュン, 岩崎, 神取, 小原, 横尾. 部分観測可能マルコフ決定過程を用いた私的観測付き繰り返しゲームにおける均衡分析プログラム. 情報処理学会論文誌, pp. 1234-1246,2012.
森村. 強化学習. 講談社, 2019.
西野上, 五十嵐, 岩崎. 私的観測下の繰り返し囚人のジレンマにおける協力のダイナミクス. 第19回情報科学技術フォーラム, 2020.

, , ,

前のページに戻る