文献
J-GLOBAL ID:200902280699010655   整理番号:04A0654021

POMDPs環境下での経験強化型強化学習法

The Exploitation Reinforcement Learning Method on POMDPs
著者 (3件):
資料名:
巻: 104  号: 233(AI2004 12-18)  ページ: 1-5  発行年: 2004年07月29日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習法は,試行錯誤により報酬を獲得し,その報酬情報により...
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
,...
準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

   続きはJDreamIII(有料)にて  {{ this.onShowAbsJLink("http://jdream3.com/lp/jglobal/index.html?docNo=04A0654021&from=J-GLOBAL&jstjournalNo=S0532B") }}
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
引用文献 (10件):
  • GREFENSTETTE, J. J. Credit Assignment in Rule Discovery Systems Based on Genetic Algorithms. Machine Learning. 1988, 3, 225-245
  • RUMMERY, G. A. On-line Q-learning Using Connectionist Systems. Technical Report. 1994
  • SUTTON, R. S. Integrated architecture for learning, planning, and reacting based on approximating dynamic programing. Proc. of 7th International Conference on Machine Learning, 1990. 1990, 216-224
  • SUTTON, R. S. Learning to Predict by Method of Temporal Differences. Machine Learning. 1988, 4, 9-44
  • WATKINS, C. J. C. H. Technical Note : Q-Learning. Machine Learning. 1992, 8, 279-292
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る