文献
J-GLOBAL ID:202202251803411060   整理番号:22A0619549

有限遷移確率集合に対するロバスト強化学習

Robust Reinforcement Learning for Finite Transition Probability Set
著者 (2件):
資料名:
巻: 2021  ページ: ROMBUNNO.B1-3  発行年: 2022年01月07日 
JST資料番号: L2343B  資料種別: 会議録 (C)
記事区分: 短報  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・有限MDP(Markov decision process)の有限集合に対する確率的最短経路問題を定義。
・設定した問題に対する準最適方策の導出。
・数値例として迷路問題を検討することで,提案手法が有限MDPの有限集合に対するコストの上限を抑えることを提示。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
引用文献 (8件):
  • A. S. Polydoros and L. Nalpantidis: Survey of model-based reinforcement learning: applications on robotics. J. Intell. Robotics Syst., 86-2, 153/173 (2017)
  • R. Sutton and A. Barto: Reinforcement learning: an introduction, MIT Press (1998)
  • J. Morimoto and K. Doya: Robust reinforcement learning. Neural computation, 17-2, 335/359 (2005).
  • D. P. Bertsekas and S. E. Shreve: Stochastic optimal control: the discrete-time case, Athena Scientific (1996)
  • M. Duff: Design for an optimal probe, Proc. of the 19th Intl. Conf. on Machine Learning (ICML), 131/138 (2003)
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る