文献
J-GLOBAL ID:201302259451895166   整理番号:13A0422707

マルコフ決定過程タスクにおける様々な人のアクション選択挙動を説明する異なる温度パラメータを有する強化学習エージェント

Reinforcement-learning agents with different temperature parameters explain the variety of human action-selection behavior in a Markov decision process task
著者 (4件):
資料名:
巻: 72  号: 7-9  ページ: 1979-1984  発行年: 2009年 
JST資料番号: O4225A  ISSN: 0925-2312  資料種別: 逐次刊行物 (A)
発行国: その他 (ZZZ)  言語: 英語 (EN)

前のページに戻る