文献
J-GLOBAL ID:200902179614419727
整理番号:00A0370480
Markov決定過程のためのアクタ-クリティック型学習アルゴリズム
Actor-critic-type learning algorithms for Markov decision processes.
著者 (2件):
KONDA V R
(Massachusetts Inst. Technol., MA)
,
BORKAR V S
(Tata Inst. Fundamental Res., Mumbai, IND)
資料名:
SIAM Journal on Control and Optimization (Society for Industrial and Applied Mathematics)
(SIAM Journal on Control and Optimization (Society for Industrial and Applied Mathematics))
巻:
38
号:
1
ページ:
94-123
発行年:
1999年11月
JST資料番号:
B0653A
ISSN:
0363-0129
CODEN:
SJCODC
資料種別:
逐次刊行物 (A)
記事区分:
原著論文
発行国:
アメリカ合衆国 (USA)
言語:
英語 (EN)