文献
J-GLOBAL ID:200902168890320368
整理番号:01A0256032
部分観測マルコフ決定過程における位置ベクトルを用いた強化学習手法の提案
A New Method for Reinforcement Learning with Position Vector in Partially Observable Markov Decision Process.
著者 (2件):
清本盛明
(立命館大 大学院理工学研究科)
,
亀井且有
(立命館大 理工)
資料名:
システム制御情報学会論文誌
(Transactions of the Institute of Systems, Control and Information Engineers)
巻:
14
号:
2
ページ:
86-91
発行年:
2001年02月
JST資料番号:
L0070A
ISSN:
1342-5668
資料種別:
逐次刊行物 (A)
記事区分:
原著論文
発行国:
日本 (JPN)
言語:
日本語 (JA)