文献
J-GLOBAL ID:200902245028276324
整理番号:04A0184447
方策勾配法を用いた動的行動則の獲得:2足歩行運動への適用
Learning a dynamic policy by using policy gradient: Application to biped walking
著者 (5件):
松原崇充
(奈良先端科学技術大学院大)
,
森本淳
(ATR脳情報研)
,
中西淳
(ATR脳情報研)
,
佐藤雅昭
(ATR脳情報研)
,
銅谷賢治
(ATR脳情報研)
資料名:
電子情報通信学会技術研究報告
(IEICE Technical Report (Institute of Electronics, Information and Communication Engineers))
巻:
103
号:
602(NC2003 119-134)
ページ:
53-58
発行年:
2004年01月27日
JST資料番号:
S0532B
ISSN:
0913-5685
資料種別:
会議録 (C)
記事区分:
原著論文
発行国:
日本 (JPN)
言語:
日本語 (JA)