文献
J-GLOBAL ID:200902182430422912   整理番号:96A0330145

MarcoPolo-報酬獲得と環境同定のトレードオフを考慮した学習システム

MarcoPolo-A Reinforcement Learning System considering tradeoff exploitation and exploration under Markovian Environment.
著者 (3件):
資料名:
巻: 8th  ページ: 121-126  発行年: 1996年01月 
JST資料番号: L2565A  資料種別: 会議録 (C)
発行国: 日本 (JPN)  言語: 日本語 (JA)
引用文献 (10件):
もっと見る

前のページに戻る