文献
J-GLOBAL ID:200902248042684604   整理番号:05A0410486

自然TD学習:割引報酬におけるTD誤差を利用する自然方策勾配に基づいた強化学習法

Natural TD Learning: Efficient Use of TD-error for Natural Policy Gradient Reinforcement Learning with Discounted Rewards
著者 (3件):
資料名:
巻: 104  号: 759(NC2004 169-192)  ページ: 137-142  発行年: 2005年03月22日 
JST資料番号: S0532B  ISSN: 0913-5685  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,環境との相互作用を通じて学習する手法である強化学習が注...
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
,...
準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
,...
   続きはJDreamIII(有料)にて  {{ this.onShowAbsJLink("http://jdream3.com/lp/jglobal/index.html?docNo=05A0410486&from=J-GLOBAL&jstjournalNo=S0532B") }}
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  数値計算 
引用文献 (17件):
もっと見る
タイトルに関連する用語 (6件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る