Zou Lixin について
Tsinghua University, Beijing, China について
Xia Long について
York University, Toronto, Canada について
University of Montreal, Montreal, Canada について
Zhang Zhuo について
University of Melbourne, Melbourne, Australia について
Bai Ting について
Beijing University of Posts and Telecommunications, Beijing, China について
Liu Weidong について
Tsinghua University, Beijing, China について
Nie Jian-Yun について
University of Montreal, Montreal, Canada について
Yin Dawei について
JD Data Science Lab, Beijing, China について
ACM Proceedings について
モンテカルロ法 について
最適化 について
相互作用 について
学習 について
シミュレータ について
伐木 について
バイアス について
エージェント について
強化学習 について
対話型 について
計算コスト について
オンライン について
時間差 について
オフライン について
報酬関数 について
顧客シミュレータ について
モデルベース強化学習 について
オフライン政策学習 について
擬似ダイナ-q について
レコメンダーシステム について
人工知能 について
対話型 について
推薦 について
擬似 について
強化学習 について
フレームワーク について