文献
J-GLOBAL ID:200902176508281849
整理番号:00A0935561
確定的Markov決定過程上のQ-ae学習の収束と確率的環境におけるその効率
Convergence of the Q-ae Learning on Deterministic MDPs and Its Efficiency on the Stochastic Environment.
著者 (3件):
ZHAO G
(Osaka City Univ., Osaka-shi, JPN)
,
TATSUMI S
(Osaka City Univ., Osaka-shi, JPN)
,
SUN R
(Liaoning Univ., Shenyang-shi, CHN)
資料名:
IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences (Institute of Electronics, Information and Communication Engineers)
(IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences (Institute of Electronics, Information and Communication Engineers))
巻:
E83-A
号:
9
ページ:
1786-1795
発行年:
2000年09月25日
JST資料番号:
F0699C
ISSN:
0916-8508
資料種別:
逐次刊行物 (A)
記事区分:
原著論文
発行国:
日本 (JPN)
言語:
英語 (EN)