文献
J-GLOBAL ID:202202219241724840   整理番号:22A0590191

リーダフォロワ部分観測確率ゲームのための最悪ケース解析【JST・京大機械翻訳】

Worst-case analysis for a leader-follower partially observable stochastic game
著者 (2件):
資料名:
巻: 54  号:ページ: 376-389  発行年: 2022年 
JST資料番号: D0695A  ISSN: 2472-5854  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: イギリス (GBR)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
部分的可観測確率ゲーム(POSGs)は,不確実性と部分情報の下でマルチエージェント動的意思決定をモデル化するための強力な数学的パラダイムを提供するが,それらは解決するのが困難であり(例えば,共通パイオフPOSGsはNEXP完全である),各エージェントに関する広範囲なデータ要求を持っている。後者は,彼/彼女がその敵対の知識を限定するならば,防御エージェントへの重大な挑戦を表すかもしれない。最悪ケース解析は,広告に関するモデル計算複雑性とデータ要求の両方を著しく減らすことができる。さらに,(近)最適最悪ケース政策は,リスク回避防御者(例えばベンチマーク)のための行動選択のための有用な指針であるかもしれない。本稿では,リーダ-フォローPOSGに対する最悪ケース解析を紹介した。(i)防御リーダは,意思決定者の報酬構造,合理性のレベル,および意思決定に関連するデータの収集と送信のためのプロセスの知識がほとんどない。(ii)目的は,最良の最悪ケース値関数とリーダのための制御戦略を決定することである。最悪ケース仮定は,このPOSGを,簡単な十分な統計で,より計算可能な単一エージェント問題に変換することを示した。しかし,部分観測Markov決定プロセスの値関数とは対照的に,価値関数は非凸である。有限水平事例に対するリーダの値関数とその制御ポリシーの下限を計算するための反復解法を設計した。このアプローチを,セキュリティ例における意思決定を支援するために,数値的に例証した。Please refer to the publisher for the copyright holders. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  ゲーム理論 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る