文献
J-GLOBAL ID:201702271672469728
整理番号:17A1257156
伐採された盗賊フィードバックからの学習のためのリスク回避ツリー【Powered by NICT】
Risk-averse trees for learning from logged bandit feedback
著者 (5件):
Trovo Francesco
(Dipartimento di Elettronica, Informazione e Bioingegneria, Polite ́cnico di Milano, Milano, Italy)
,
Paladino Stefano
(Dipartimento di Elettronica, Informazione e Bioingegneria, Polite ́cnico di Milano, Milano, Italy)
,
Simone Paolo
(Dipartimento di Elettronica, Informazione e Bioingegneria, Polite ́cnico di Milano, Milano, Italy)
,
Restelli Marcello
(Dipartimento di Elettronica, Informazione e Bioingegneria, Polite ́cnico di Milano, Milano, Italy)
,
Gatti Nicola
(Dipartimento di Elettronica, Informazione e Bioingegneria, Polite ́cnico di Milano, Milano, Italy)
資料名:
IEEE Conference Proceedings
(IEEE Conference Proceedings)
巻:
2017
号:
IJCNN
ページ:
976-983
発行年:
2017年
JST資料番号:
W2441A
資料種別:
会議録 (C)
記事区分:
原著論文
発行国:
アメリカ合衆国 (USA)
言語:
英語 (EN)