文献
J-GLOBAL ID:202202230485171259   整理番号:22A0754452

クールノー競争におけるマルチエージェント強化学習に関する研究

著者 (4件):
資料名:
巻: 84th  号:ページ: 2.11-2.12  発行年: 2022年02月17日 
JST資料番号: S0731A  資料種別: 会議録 (C)
記事区分: 短報  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・本研究では,クールノーゲーム(CNG)において,個々のエージェントが強化学習アルゴリズムに従った場合どのような振る舞いをするかを分析。
・市場を支配する企業が2社の寡占市場で同質材の供給量を決定するようなクールノー競争のモデルを考え,計算実験の結果エージェントは非協力的な戦略を学習すること判明。
・例えば行列数15のCNGでNeuRMDの獲得報酬をQ-学習と比較した結果,平均報酬値は時間減衰するQ-学習に比べ,前者は非協力的な方策を学習すること判明。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
引用文献 (4件):
  • E. Calvano, G. Calzolari, V. Denicoló, and S. Pastorello. Algorithmic collusion with imperfect monitoring. International Journal of Industrial Organization, 2021. To appear.
  • ヨンジュン, 岩崎, 神取, 小原, 横尾. 部分観測可能マルコフ決定過程を用いた私的観測付き繰り返しゲームにおける均衡分析プログラム. 情報処理学会論文誌, pp. 1234-1246,2012.
  • 森村. 強化学習. 講談社, 2019.
  • 西野上, 五十嵐, 岩崎. 私的観測下の繰り返し囚人のジレンマにおける協力のダイナミクス. 第19回情報科学技術フォーラム, 2020.
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る