SIPOMDPLite-Net:スパース相互作用を持つPOSGにおける軽量,自己関心学習および計画【JST・京大機械翻訳】

Zhang Gengyu; Doshi Prashant

プレプリント

J-GLOBAL ID：202202202856880962 整理番号：22P0293800

SIPOMDPLite-Net:スパース相互作用を持つPOSGにおける軽量,自己関心学習および計画【JST・京大機械翻訳】

SIPOMDPLite-Net: Lightweight, Self-Interested Learning and Planning in POSGs with Sparse Interactions

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年02月22日プレプリントサーバーでの情報更新日： 2022年02月22日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

本研究では,エージェント間の疎な相互作用を有する部分観測可能確率ゲーム(POSG)における分散自己干渉エージェント制御のための深層ニューラルネットワーク(DNN)アーキテクチャsIPOMDPLiteネットを導入した。ネットワークは,対話型部分観測Markov決定プロセス(I-POMDP)Liteフレームワークによってモデル化される文脈で計画し,階層構造値反復ネットワークを用いて,その挙動をモデル化し,その意図を予測する他のエージェントに対するI-POMDP Lite属性を,入れ子MDPsの解をシミュレーションした。sIPOMDPLite-netを,小さな2エージェントのTiger-グリッドタスクの専門家の実証で訓練し,そのために,基礎となるI-POMDP Liteモデルと近最適政策を正確に学習し,政策は,より大きなグリッドと実世界の地図でうまく実行を継続する。このように,sIPOMDPLite-netは良好な移動能力を示し,マルチエージェント設定における個人,自己干渉エージェントのためのより軽い学習と計画アプローチを提供する。【JST・京大機械翻訳】

, , , , , ,
, , , , , , , 【Automatic Indexing@JST】

計算機網 , 果樹

, , , , ,

前のページに戻る