文献
J-GLOBAL ID:200902200207932249
整理番号:04A0361091
二足歩行運動に対する方策勾配法に基づいた強化学習法
Reinforcement learning based on a policy gradient method for biped locomotion
著者 (3件):
森健
(奈良先端科学技術大学院大)
,
中村泰
(奈良先端科学技術大学院大)
,
石井信
(奈良先端科学技術大学院大)
資料名:
電子情報通信学会技術研究報告
(IEICE Technical Report (Institute of Electronics, Information and Communication Engineers))
巻:
103
号:
734(NC2003 194-223)
ページ:
73-78
発行年:
2004年03月19日
JST資料番号:
S0532B
ISSN:
0913-5685
資料種別:
会議録 (C)
記事区分:
原著論文
発行国:
日本 (JPN)
言語:
日本語 (JA)