文献
J-GLOBAL ID:201702231319086012
整理番号:17A1385770
多目的強化学習のためのソフトマックス探査戦略【Powered by NICT】
Softmax exploration strategies for multiobjective reinforcement learning
著者 (3件):
Vamplew Peter
(Federation Learning Agents Group, School of Engineering and Information Technology, Federation University Australia, Ballarat, Victoria, Australia)
,
Dazeley Richard
(Federation Learning Agents Group, School of Engineering and Information Technology, Federation University Australia, Ballarat, Victoria, Australia)
,
Foale Cameron
(Federation Learning Agents Group, School of Engineering and Information Technology, Federation University Australia, Ballarat, Victoria, Australia)
資料名:
Neurocomputing
(Neurocomputing)
巻:
263
ページ:
74-86
発行年:
2017年
JST資料番号:
W0360A
ISSN:
0925-2312
資料種別:
逐次刊行物 (A)
記事区分:
原著論文
発行国:
オランダ (NLD)
言語:
英語 (EN)