文献
J-GLOBAL ID:202202270238880354
整理番号:22A0934543
DA3:マルチエージェント深層強化学習における協調行動の解釈性確立と対ノイズ性能の検証
-
出版者サイト
{{ this.onShowPLink() }}
複写サービスで全文入手
{{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=22A0934543©=1") }}
-
高度な検索・分析はJDreamⅢで
{{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=22A0934543&from=J-GLOBAL&jstjournalNo=U0451A") }}
著者 (2件):
,
資料名:
巻:
2022
号:
ICS-205
ページ:
Vol.2022-ICS-205,No.8,1-8 (WEB ONLY)
発行年:
2022年02月14日
JST資料番号:
U0451A
資料種別:
会議録 (C)
記事区分:
原著論文
発行国:
日本 (JPN)
言語:
日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本稿では,マルチエージェント深層強化学習におけるノイズの影響度を学習し,自律的に抑制するdistributed attentional actor architecture model for multi-agent system(DA3)を提案する.ノイズは多くの分野に存在し,長年の間その特性の解明や抑制手法が考案されてきた.特に,周囲の限られた情報をもとに他のエージェントとの協調・調整,さらに相互協力を前提とした互恵行動を獲得する必要のあるマルチエージェントシステムにおいても,ノイズ抑制や排除は重要な研究テーマである.本提案であるDA3はattention mechanismを内包しているため,エージェントは観測情報を取捨選択しながら環境に適応することが可能である.実験結果から,観測情報内のノイズや協調行動に無関係な第三者的エージェントに惑わされることなく,他エージェントとの協調行動を獲得し,attention mechanismを持たないベースライン(ここではDQN)よりも高い学習性能を達成することを示す.また,DA3内部に存在するattentional weightsを解析することで,これまでブラックボックスとされてきたエージェントの行動決定過程におけるノイズの影響度などを把握できることを示す.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
,
,
,
,
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
ロボットの運動・制御
引用文献 (25件):
-
Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J. and Houlsby, N.: An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale, International Conference on Learning Representations (2021).
-
Fortunato, M., Azar, M. G., Piot, B., Menick, J., Hessel, M., Osband, I., Graves, A., Mnih, V., Munos, R., Hassabis, D., Pietquin, O., Blundell, C. and Legg, S.: Noisy Networks For Exploration, International Conference on Learning Representations (2018).
-
Han, S., Zhou, W., Liu, J. and Lü, S.: NROWAN-DQN: A Stable Noisy Network with Noise Reduction and Online Weight Adjustment for Exploration, CoRR (2020).
-
Hendrycks, D., Mazeika, M., Wilson, D. and Gimpel, K.: Using Trusted Data to Train Deep Networks on Labels Corrupted by Severe Noise, Advances in Neural Information Processing Systems (Bengio, S., Wallach, H., Larochelle, H., Grauman, K., Cesa-Bianchi, N. and Garnett, R., eds.), Vol. 31, Curran Associates, Inc. (2018).
-
Kilinc, O. and Montana, G.: Multi-agent Deep Reinforcement Learning with Extremely Noisy Observations (2018).
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです
,
,
,
,
前のページに戻る