プレプリント
J-GLOBAL ID:202202214219193143   整理番号:22P0333882

反事実的信用割当によるマルチエージェント強化学習を用いたマルチUAV衝突回避【JST・京大機械翻訳】

Multi-UAV Collision Avoidance using Multi-Agent Reinforcement Learning with Counterfactual Credit Assignment
著者 (3件):
資料名:
発行年: 2022年04月18日  プレプリントサーバーでの情報更新日: 2022年04月18日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
マルチUAV衝突回避は,衝突フリー経路計画のためのスウォームメンバー間の緊密な協調の必要性のために,UAVスウォームアプリケーションのための挑戦的なタスクである。マルチエージェント強化学習における分散実行(CTDE)による集中訓練は,マルチUAV衝突回避のための有望な方法であり,その中で,鍵課題は,グローバル報酬を協調的に最大化できる分散ポリシーを効果的に学習することである。UAVスウォーム衝突回避のためのMACAと呼ばれる新しいマルチエージェント批評者学習方式を提案した。MACAは,安全とエネルギー効率の両方を考慮する割引されたグローバル報酬と,衝突を回避するための分散政策を見つけるためのUAV当りのアクターを最大限にするために集中批判を使用する。CTDEにおける信用割当て問題を解決するために,エージェントの状態と行動の両方を制限する対抗的ベースラインを設計し,関節観察行動空間におけるエージェントの重要性を評価することができた。MACAを訓練し,評価するために,UAVスウォームの現実的行動を厳密に模倣するために,著者ら自身のシミュレーション環境MACAEnvを設計した。シミュレーション結果は,MACAが2つの最先端のMARLアルゴリズムより16%以上の平均報酬を達成して,すべてのテストシナリオにおける従来のUAVスウォーム衝突回避アルゴリズムと比較して,故障率を90%,応答時間を99%以上低減することを示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 

前のページに戻る