文献
J-GLOBAL ID:200902273164932662
整理番号:05A0410485
自然方策勾配法に基づくオフポリシー型強化学習法
An off-policy reinforcement learning method based on a natural policy gradient method
著者 (2件):
中村泰
(JST-CREST)
,
石井信
(奈良先端科学技術大学院大)
資料名:
電子情報通信学会技術研究報告
(IEICE Technical Report (Institute of Electronics, Information and Communication Engineers))
巻:
104
号:
759(NC2004 169-192)
ページ:
131-136
発行年:
2005年03月22日
JST資料番号:
S0532B
ISSN:
0913-5685
資料種別:
会議録 (C)
記事区分:
原著論文
発行国:
日本 (JPN)
言語:
日本語 (JA)