文献
J-GLOBAL ID:202202213906354040   整理番号:22A0551379

ME-MADDPG:複雑な環境における複数エージェントのための効率的学習ベース運動計画法【JST・京大機械翻訳】

ME-MADDPG: An efficient learning-based motion planning method for multiple agents in complex environments
著者 (6件):
資料名:
巻: 37  号:ページ: 2393-2427  発行年: 2022年 
JST資料番号: T0454A  ISSN: 0884-8173  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
マルチエージェントのための効率的な動きポリシーの開発は,分散動的状況における課題であり,そこでは,各エージェントが,含まれる他のエージェントのポリシーを知らなくても,それ自身の経路を計画する。本論文では,マルチエージェントシステムのための効率的な学習ベース運動計画法を示した。それは,マルチエージェント深い決定論的政策勾配(MADDPG)のフレームワークを採用して,複数エージェントのための運動コマンドに部分的観察情報を直接写像する。サンプル利用におけるMADDPGの効率を改善するために,より複雑な環境に適応できるよりブリリアントなエージェントを訓練するために,混合経験(ME)と呼ばれる戦略をMADDPGに導入し,提案したME-MADDPGアルゴリズムを導いた。新規ME戦略は3つの特異的機構に具体化できる。(1)初期訓練段階で高品質試料を生産するための人工ポテンシャル場ベースサンプル発生器;(2)動的混合サンプリング戦略は,可変比率によっていろいろな供給源からトレーニングデータを混合する。(3)複数のエージェントの訓練を安定させるための遅延学習スキル。提案したME-MADDPGアルゴリズムの性能を検証するために,一連の実験を行い,MADDPGと比較して,提案アルゴリズムは訓練プロセスにおける収束速度と収束効果を著しく改善し,また,複雑な動的環境においてより良い効率とより良い適応性を示し,一方,マルチエージェント運動計画アプリケーションのために使用することを示した。Copyright 2022 Wiley Publishing Japan K.K. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る