ME-MADDPG:複雑な環境における複数エージェントのための効率的学習ベース運動計画法【JST・京大機械翻訳】

Wan Kaifang; Wu Dingwei; Li Bo; Gao Xiaoguang; Hu Zijian; Chen Daqing

文献

J-GLOBAL ID：202202213906354040 整理番号：22A0551379

ME-MADDPG:複雑な環境における複数エージェントのための効率的学習ベース運動計画法【JST・京大機械翻訳】

ME-MADDPG: An efficient learning-based motion planning method for multiple agents in complex environments

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=22A0551379&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=22A0551379&from=J-GLOBAL&jstjournalNo=T0454A") }}

著者 (6件)： , , , , ,
資料名：
巻： 37 号： 3 ページ： 2393-2427 発行年： 2022年
JST資料番号： T0454A ISSN： 0884-8173 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

マルチエージェントのための効率的な動きポリシーの開発は,分散動的状況における課題であり,そこでは,各エージェントが,含まれる他のエージェントのポリシーを知らなくても,それ自身の経路を計画する。本論文では,マルチエージェントシステムのための効率的な学習ベース運動計画法を示した。それは,マルチエージェント深い決定論的政策勾配(MADDPG)のフレームワークを採用して,複数エージェントのための運動コマンドに部分的観察情報を直接写像する。サンプル利用におけるMADDPGの効率を改善するために,より複雑な環境に適応できるよりブリリアントなエージェントを訓練するために,混合経験(ME)と呼ばれる戦略をMADDPGに導入し,提案したME-MADDPGアルゴリズムを導いた。新規ME戦略は3つの特異的機構に具体化できる。(1)初期訓練段階で高品質試料を生産するための人工ポテンシャル場ベースサンプル発生器;(2)動的混合サンプリング戦略は,可変比率によっていろいろな供給源からトレーニングデータを混合する。(3)複数のエージェントの訓練を安定させるための遅延学習スキル。提案したME-MADDPGアルゴリズムの性能を検証するために,一連の実験を行い,MADDPGと比較して,提案アルゴリズムは訓練プロセスにおける収束速度と収束効果を著しく改善し,また,複雑な動的環境においてより良い効率とより良い適応性を示し,一方,マルチエージェント運動計画アプリケーションのために使用することを示した。Copyright 2022 Wiley Publishing Japan K.K. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , , ,
, , , , , , 【Automatic Indexing@JST】

著者キーワード (4件)： , , ,

人工知能

, , ,

前のページに戻る