エージェント間の干渉検出による学習空間の抑制

本木雄斗; 荒井幸代

文献

J-GLOBAL ID：201902216112691325 整理番号：19A0148067

エージェント間の干渉検出による学習空間の抑制

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=19A0148067&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=19A0148067&from=J-GLOBAL&jstjournalNo=F0428D") }}

著者 (2件)： ,
資料名：
巻： 2018 ページ： ROMBUNNO.GS0208 発行年： 2018年11月25日
JST資料番号： F0428D 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

マルチエージェント強化学習では,エージェント間の相互作用を考慮して,他エージェントの状態や行動の観測が必要となる。すべての状態と行動を共有すれば,その学習空間はエージェント数の増加に伴い膨大になり,遅れのある報酬だけでは学習効率が極端に低下し,学習できない場合も生じる。ただし,エージェント間の相互作用が疎であれば,「学習に影響を及ぼす(干渉とよぶ)状態-行動対」は限られるために,干渉する場合を検出し,これに限定して,他エージェントを観測すればよいはずである。従来の干渉検出法では,状態-行動価値の学習であっても,干渉しうる「状態」だけに着目し「行動」を考慮していないため,状態遷移先の不確定性によって干渉検出の精度を低下させている。そこで本論文では,エージェント間の干渉検出において,「状態」に加えて「行動」を考慮することによって,精度の高い干渉検出を実現し,学習空間を抑制しつつ,解の最適性や学習速度を向上させる方法として,オフライン手法とオンライン手法の二つを提案する。(著者抄録)

, , , , , , ,
, , , , , ,

人工知能

前のページに戻る