DA3:マルチエージェント深層強化学習における協調行動の解釈性確立と対ノイズ性能の検証

元川善就; 菅原俊治

文献

J-GLOBAL ID：202202270238880354 整理番号：22A0934543

DA3:マルチエージェント深層強化学習における協調行動の解釈性確立と対ノイズ性能の検証

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=22A0934543&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=22A0934543&from=J-GLOBAL&jstjournalNo=U0451A") }}

著者 (2件)： ,
資料名：
巻： 2022 号： ICS-205 ページ： Vol.2022-ICS-205,No.8,1-8 (WEB ONLY) 発行年： 2022年02月14日
JST資料番号： U0451A 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

本稿では,マルチエージェント深層強化学習におけるノイズの影響度を学習し,自律的に抑制するdistributed attentional actor architecture model for multi-agent system(DA3)を提案する.ノイズは多くの分野に存在し,長年の間その特性の解明や抑制手法が考案されてきた.特に,周囲の限られた情報をもとに他のエージェントとの協調・調整,さらに相互協力を前提とした互恵行動を獲得する必要のあるマルチエージェントシステムにおいても,ノイズ抑制や排除は重要な研究テーマである.本提案であるDA3はattention mechanismを内包しているため,エージェントは観測情報を取捨選択しながら環境に適応することが可能である.実験結果から,観測情報内のノイズや協調行動に無関係な第三者的エージェントに惑わされることなく,他エージェントとの協調行動を獲得し,attention mechanismを持たないベースライン(ここではDQN)よりも高い学習性能を達成することを示す.また,DA3内部に存在するattentional weightsを解析することで,これまでブラックボックスとされてきたエージェントの行動決定過程におけるノイズの影響度などを把握できることを示す.(著者抄録)

, , , ,

ロボットの運動・制御

引用文献 (25件)：

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J. and Houlsby, N.: An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale, International Conference on Learning Representations (2021).
Fortunato, M., Azar, M. G., Piot, B., Menick, J., Hessel, M., Osband, I., Graves, A., Mnih, V., Munos, R., Hassabis, D., Pietquin, O., Blundell, C. and Legg, S.: Noisy Networks For Exploration, International Conference on Learning Representations (2018).
Han, S., Zhou, W., Liu, J. and Lü, S.: NROWAN-DQN: A Stable Noisy Network with Noise Reduction and Online Weight Adjustment for Exploration, CoRR (2020).
Hendrycks, D., Mazeika, M., Wilson, D. and Gimpel, K.: Using Trusted Data to Train Deep Networks on Labels Corrupted by Severe Noise, Advances in Neural Information Processing Systems (Bengio, S., Wallach, H., Larochelle, H., Grauman, K., Cesa-Bianchi, N. and Garnett, R., eds.), Vol. 31, Curran Associates, Inc. (2018).
Kilinc, O. and Montana, G.: Multi-agent Deep Reinforcement Learning with Extremely Noisy Observations (2018).

, , , ,

前のページに戻る