文献
J-GLOBAL ID:201002244230020557
整理番号:10A1526397
パラメータ探索ポリシー勾配のための多次元深層メモリAtari囲碁プレーヤ
Multi-Dimensional Deep Memory Atari-Go Players for Parameter Exploring Policy Gradients
著者 (4件):
GRUETTNER Mandy
(Technische Univ. Muenchen, DEU)
,
SEHNKE Frank
(Technische Univ. Muenchen, DEU)
,
SCHAUL Tom
(Univ. Lugano, CHE)
,
SCHMIDHUBER Juergen
(Univ. Lugano, CHE)
資料名:
Lecture Notes in Computer Science
(Lecture Notes in Computer Science)
巻:
6353
ページ:
114-123
発行年:
2010年
JST資料番号:
H0078D
ISSN:
0302-9743
資料種別:
会議録 (C)
発行国:
ドイツ (DEU)
言語:
英語 (EN)