抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
マルチUAV衝突回避は,衝突フリー経路計画のためのスウォームメンバー間の緊密な協調の必要性のために,UAVスウォームアプリケーションのための挑戦的なタスクである。マルチエージェント強化学習における分散実行(CTDE)による集中訓練は,マルチUAV衝突回避のための有望な方法であり,その中で,鍵課題は,グローバル報酬を協調的に最大化できる分散ポリシーを効果的に学習することである。UAVスウォーム衝突回避のためのMACAと呼ばれる新しいマルチエージェント批評者学習方式を提案した。MACAは,安全とエネルギー効率の両方を考慮する割引されたグローバル報酬と,衝突を回避するための分散政策を見つけるためのUAV当りのアクターを最大限にするために集中批判を使用する。CTDEにおける信用割当て問題を解決するために,エージェントの状態と行動の両方を制限する対抗的ベースラインを設計し,関節観察行動空間におけるエージェントの重要性を評価することができた。MACAを訓練し,評価するために,UAVスウォームの現実的行動を厳密に模倣するために,著者ら自身のシミュレーション環境MACAEnvを設計した。シミュレーション結果は,MACAが2つの最先端のMARLアルゴリズムより16%以上の平均報酬を達成して,すべてのテストシナリオにおける従来のUAVスウォーム衝突回避アルゴリズムと比較して,故障率を90%,応答時間を99%以上低減することを示した。【JST・京大機械翻訳】