文献
J-GLOBAL ID:201502240644540030   整理番号:15A0609539

あるクラスのジレンマ問題に対するマルチエージェント強化学習法

Multi-agent Reinforcement Learning Method for a Class of Dilemma Problems
著者 (2件):
資料名:
巻: 51  号:ページ: 352-360  発行年: 2015年05月31日 
JST資料番号: S0104A  ISSN: 0453-4654  CODEN: KJSRA  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
あるクラスのジレンマ問題に対して,マルチエージェントシステムの各エージェントが協調行動を学習する強化学習法を提案した。本研究の目的は,ジレンマ問題において,システム全体の目的を達成する方策を各エージェントが自律的に獲得するマルチエージェント強化学習法を開発することである。本論文では,あるクラスのジレンマ問題を確率ゲームの定義を用いて定式化し,その問題に対して協調行動を学習する強化学習法を提案した。提案学習法では,最初に他エージェントに期待する方策を考えて,最大の収益が得られる行動を選択する。行動の結果,最大収益が得られなければ,現状より収益が高い別の方策を他エージェントに期待して次の行動を選択していく。これにより協調行動の獲得が期待できる。囚人のジレンマと共有地の悲劇問題に適用した数値実験により,提案学習法の有効性を確認した。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
引用文献 (10件):
  • 1) L. Busoniu and R. Babuska: Comprehensive Survey of Multiagent Reinforcement Learning, IEEE Transactions on Systems, Man, and Cybernetics — PART C, 38-2, 156/172 (2008)
  • 2) X. Yao and P.J. Darwen: An Experimental Study of N-person Iterated Prisoner's Dilemma Games, Informatica, 18-4, 435/450 (1994)
  • 3) T.W. Sandholm and R.H. Crites: On Multiagent Q-Learning in a Semi-competitive Domain, Proceedings of the Workshop on Adaption and Learning in Multi-Agent Systems, 191/205 (1995)
  • 4) T. Makino and K. Aihara: Multi-agent reinforcement learning algorithm to handle beliefs of other agents' policies and embedded beliefs, Proceeding of International Joint Conference on Autonomous Agents and Multiagent Systems, 789/791 (2006)
  • 5) D. Banerjee and S. Sen: Reaching Pareto-optimality in prisoner's dilemma using conditional joint action learning, Autonomous Agents and Multiagent System, 15-1, 91/108 (2007)
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る