文献
J-GLOBAL ID:201302255306392347   整理番号:13A0026256

時間整合的マルコフ決定過程のロバスト性

Robustness of time-consistent Markov decision processes
著者 (1件):
資料名:
巻: 112  号: 279(IBISML2012 34-92)  ページ: 45-52  発行年: 2012年10月31日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
マルコフ決定過程(MDP)の目的関数が,単調性を持つ反復的リスク指標である場合には,そのMDPの最適施策が動的計画法によって求められることを示す。単調性を持つ反復的リスク指標が更に並進不変性を持つ場合には,MDPの最適施策がより効率的に求められることを示す。期待効用では表現できないが理にかなっていると思われるリスク選好が,反復的リスク指標で表現できることを示す。更に,ある反復的リスク指標の最小化を目的とするMDPは,ロバストMDPとして解釈できることを示す。ロバストMDPは,MDPのパラメータ値が不確実であることを前提とし,最悪の場合に対して,累積期待コストなどを最小化することを目的とする。具体的には,期待指数効用の最小化を目的とするMDPは,期待値からパラメータの基準値からの乖離度のカルバック・ライブラー距離を減じた値を,最悪の場合において最小化するロバストMDPと等価であることを示す。また,コヒーレントなリスク指標からなる反復的リスク指標の値を最小化することを目的とするMDPは,ある凹関数によって不確実性が特徴付けられるロバストMDPと等価であることを示す。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
数理計画法 
引用文献 (8件):
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る