文献
J-GLOBAL ID:201902220709841779
整理番号:19A2420409
ミニマックス深決定性ポリシー勾配のための状態表現学習【JST・京大機械翻訳】
State Representation Learning for Minimax Deep Deterministic Policy Gradient
著者 (5件):
Hu Dapeng
(Qilu University of Technology, Shandong Academy of Sciences, Jinan, China)
,
Jiang Xuesong
(Qilu University of Technology, Shandong Academy of Sciences, Jinan, China)
,
Jiang Xuesong
(Shandong College of Information Technology, Weifang, China)
,
Wei Xiumei
(Qilu University of Technology, Shandong Academy of Sciences, Jinan, China)
,
Wang Jian
(Shandong College of Information Technology, Weifang, China)
資料名:
Lecture Notes in Computer Science
(Lecture Notes in Computer Science)
巻:
11775
ページ:
481-487
発行年:
2019年
JST資料番号:
H0078D
ISSN:
0302-9743
資料種別:
会議録 (C)
記事区分:
原著論文
発行国:
ドイツ (DEU)
言語:
英語 (EN)