文献
J-GLOBAL ID:200902256489262491
整理番号:03A0334141
確率的方策勾配法に基づくactor-critic法と連続システムの制御への応用
An actor-critic method based on stochastic policy gradient and its application to control of a continuous system
著者 (3件):
森健
(奈良先端科学技術大学院大)
,
吉本潤一郎
(JST-CREST)
,
石井信
(JST-CREST)
資料名:
電子情報通信学会技術研究報告
(IEICE Technical Report (Institute of Electronics, Information and Communication Engineers))
巻:
102
号:
731(NC2002 203-234)
ページ:
137-142
発行年:
2003年03月19日
JST資料番号:
S0532B
ISSN:
0913-5685
資料種別:
会議録 (C)
記事区分:
原著論文
発行国:
日本 (JPN)
言語:
日本語 (JA)