文献
J-GLOBAL ID:202302225564043797   整理番号:23A3148798

sfDA6-X:マルチエージェント深層強化学習における戦略指令に基づいた協調行動の操作性検証

著者 (2件):
資料名:
巻: 123  号: 190(AI2023 1-36)  ページ: 66-71 (WEB ONLY)  発行年: 2023年09月05日 
JST資料番号: U2030A  ISSN: 2432-6380  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,マルチエージェント深層強化学習における協調行動の操作性の検証を目的としたstrategy-following distributed attentional actor architecture after conditional attention(sfDA6-X)を提案する.本提案であるsfDA6-Xは注意機構(attention mechanism)を内包するため,sfDA6-Xを保有するエージェント(sfDA6-Xエージェント)は外部から与えられた戦略を柔軟に認識し,より高い学習性能の達成・指令に沿った協調行動の獲得へと作用する.実験結果から,3種類の戦略指令のケース全てにおいて,既存の比較手法よりも高い学習性能を達成できることを示す.また,学習後のsfDA6-Xエージェントに異なる戦略指令を意図的に与え,システム全体の協調行動の操作可能性を検証する.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
引用文献 (10件):
  • Y. Motokawa and T. Sugawara, “Interpretability for conditional coordinated behavior in multi-agent reinforcement learning,” 2023 International Joint Conference on Neural Networks (IJCNN), pp.1-8, 2023.
  • V. Chen, A. Gupta, and K. Marino, “Ask your humans: Using human instructions to improve generalization in reinforcement learning,” International Conference on Learning Representations, pp.●●-●●, 2021. https://openreview.net/forum?id=Y87Ri-GNHYu
  • S.-H. Sun, T.-L. Wu, and J.J. Lim, “Program guided agent,” International Conference on Learning Representations, pp.●●-●●, 2020. https://openreview.net/forum?id=BkxUvnEYDH
  • Y. Yang, J.P. Inala, O. Bastani, Y. Pu, A. Solar-Lezama, and M. Rinard, “Program synthesis guided reinforcement learning for partially observed environments,” Advances in Neural Information Processing Systems, eds. by A. Beygelzimer, Y. Dauphin, P. Liang, and J.W. Vaughan, pp.●●-●●, 2021. https://openreview.net/forum?id=QwNLVId9Df
  • B. Gangopadhyay, H. Soora, and P. Dasgupta, “Hierarchical program-triggered reinforcement learning agents for automated driving,” IEEE Transactions on Intelligent Transportation Systems, vol.23, no.8, pp.10902-10911, 2022.
もっと見る

前のページに戻る