反事実的信用割当によるマルチエージェント強化学習を用いたマルチUAV衝突回避【JST・京大機械翻訳】

Huang Shuangyao; Zhang Haibo; Huang Zhiyi

プレプリント

J-GLOBAL ID：202202214219193143 整理番号：22P0333882

反事実的信用割当によるマルチエージェント強化学習を用いたマルチUAV衝突回避【JST・京大機械翻訳】

Multi-UAV Collision Avoidance using Multi-Agent Reinforcement Learning with Counterfactual Credit Assignment

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年04月18日プレプリントサーバーでの情報更新日： 2022年04月18日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

マルチUAV衝突回避は,衝突フリー経路計画のためのスウォームメンバー間の緊密な協調の必要性のために,UAVスウォームアプリケーションのための挑戦的なタスクである。マルチエージェント強化学習における分散実行(CTDE)による集中訓練は,マルチUAV衝突回避のための有望な方法であり,その中で,鍵課題は,グローバル報酬を協調的に最大化できる分散ポリシーを効果的に学習することである。UAVスウォーム衝突回避のためのMACAと呼ばれる新しいマルチエージェント批評者学習方式を提案した。MACAは,安全とエネルギー効率の両方を考慮する割引されたグローバル報酬と,衝突を回避するための分散政策を見つけるためのUAV当りのアクターを最大限にするために集中批判を使用する。CTDEにおける信用割当て問題を解決するために,エージェントの状態と行動の両方を制限する対抗的ベースラインを設計し,関節観察行動空間におけるエージェントの重要性を評価することができた。MACAを訓練し,評価するために,UAVスウォームの現実的行動を厳密に模倣するために,著者ら自身のシミュレーション環境MACAEnvを設計した。シミュレーション結果は,MACAが2つの最先端のMARLアルゴリズムより16%以上の平均報酬を達成して,すべてのテストシナリオにおける従来のUAVスウォーム衝突回避アルゴリズムと比較して,故障率を90%,応答時間を99%以上低減することを示した。【JST・京大機械翻訳】

, , , , , , , , , , , , ,
, 【Automatic Indexing@JST】

人工知能

, , , , , ,

前のページに戻る