文献
J-GLOBAL ID:200902248042684604
整理番号:05A0410486
自然TD学習:割引報酬におけるTD誤差を利用する自然方策勾配に基づいた強化学習法
Natural TD Learning: Efficient Use of TD-error for Natural Policy Gradient Reinforcement Learning with Discounted Rewards
著者 (3件):
森村哲郎
(沖縄大学院大)
,
内部英治
(沖縄大学院大)
,
銅谷賢治
(沖縄大学院大)
資料名:
電子情報通信学会技術研究報告
(IEICE Technical Report (Institute of Electronics, Information and Communication Engineers))
巻:
104
号:
759(NC2004 169-192)
ページ:
137-142
発行年:
2005年03月22日
JST資料番号:
S0532B
ISSN:
0913-5685
資料種別:
会議録 (C)
記事区分:
原著論文
発行国:
日本 (JPN)
言語:
日本語 (JA)