抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本研究では,エージェント間の疎な相互作用を有する部分観測可能確率ゲーム(POSG)における分散自己干渉エージェント制御のための深層ニューラルネットワーク(DNN)アーキテクチャsIPOMDPLiteネットを導入した。ネットワークは,対話型部分観測Markov決定プロセス(I-POMDP)Liteフレームワークによってモデル化される文脈で計画し,階層構造値反復ネットワークを用いて,その挙動をモデル化し,その意図を予測する他のエージェントに対するI-POMDP Lite属性を,入れ子MDPsの解をシミュレーションした。sIPOMDPLite-netを,小さな2エージェントのTiger-グリッドタスクの専門家の実証で訓練し,そのために,基礎となるI-POMDP Liteモデルと近最適政策を正確に学習し,政策は,より大きなグリッドと実世界の地図でうまく実行を継続する。このように,sIPOMDPLite-netは良好な移動能力を示し,マルチエージェント設定における個人,自己干渉エージェントのためのより軽い学習と計画アプローチを提供する。【JST・京大機械翻訳】