抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
マルチエージェント強化学習では,エージェント間の相互作用を考慮して,他エージェントの状態や行動の観測が必要となる。すべての状態と行動を共有すれば,その学習空間はエージェント数の増加に伴い膨大になり,遅れのある報酬だけでは学習効率が極端に低下し,学習できない場合も生じる。ただし,エージェント間の相互作用が疎であれば,「学習に影響を及ぼす(干渉とよぶ)状態-行動対」は限られるために,干渉する場合を検出し,これに限定して,他エージェントを観測すればよいはずである。従来の干渉検出法では,状態-行動価値の学習であっても,干渉しうる「状態」だけに着目し「行動」を考慮していないため,状態遷移先の不確定性によって干渉検出の精度を低下させている。そこで本論文では,エージェント間の干渉検出において,「状態」に加えて「行動」を考慮することによって,精度の高い干渉検出を実現し,学習空間を抑制しつつ,解の最適性や学習速度を向上させる方法として,オフライン手法とオンライン手法の二つを提案する。(著者抄録)