研究者
J-GLOBAL ID:202301012314546276
更新日: 2023年07月01日
Parmas Paavo
パラマス パーヴォ | Parmas Paavo
所属機関・部署:
職名:
特定助教
競争的資金等の研究課題 (1件):
- 2022 - 2027 敵対生成脳:マルチエージェント学習の計算理論、アルゴリズムとロボティクス応用
論文 (5件):
-
Paavo Parmas, Takuma Seno. Proppo: a Message Passing Framework for Customizable and Composable Learning Algorithms. NeurIPS. 2022
-
Paavo Parmas, Masashi Sugiyama. A unified view of likelihood ratio and reparameterization gradients. The 24th International Conference on Artificial Intelligence and Statistics(AISTATS). 2021. 4078-4086
-
Daniel Hennes, Dustin Morrill, Shayegan Omidshafiei, Rémi Munos, Julien Pérolat, Marc Lanctot, Audrunas Gruslys, Jean-Baptiste Lespiau, Paavo Parmas, Edgar A. Duéñez-Guzmán, et al. Neural Replicator Dynamics: Multiagent Learning via Hedging Policy Gradients. Proceedings of the 19th International Conference on Autonomous Agents and Multiagent Systems(AAMAS). 2020. 492-501
-
Paavo Parmas. Total stochastic gradient algorithms and applications in reinforcement learning. Advances in Neural Information Processing Systems 31: Annual Conference on Neural Information Processing Systems 2018(NeurIPS). 2018. 10225-10235
-
Paavo Parmas, Carl Edward Rasmussen, Jan Peters, Kenji Doya. PIPPS: Flexible Model-Based Policy Search Robust to the Curse of Chaos. Proceedings of the 35th International Conference on Machine Learning(ICML). 2018. 4062-4071
学歴 (2件):
- 2014 - 2020 沖縄科学技術大学院大学 5年間大学院コース
- 2010 - 2014 ケンブリッジ大学 工学部 4年間コース
学位 (2件):
- 博士 (沖縄科学技術大学院大学)
- 学部(学士3年・修士1年) (ケンブリッジ大学)
経歴 (4件):
- 2020/11 - 現在 京都大学 大学院情報学研究科 特定助教
- 2020/02 - 2020/10 沖縄科学技術大学院大学 ジュニア・リサーチ・フェロー
- 2019/07 - 2019/10 Google DeepMind Paris リサーチ・インターン
- 2019/04 - 2019/07 RIKEN-AIP リサーチ・インターン
受賞 (3件):
- 2020 - 沖縄科学技術大学院大学 ピーター・グルース最優秀博士論文賞 Total stochastic gradient algorithms and applications to model-based reinforcement learning
- 2014 - University of Cambridge 最優秀発表賞 情報工学卒業研究発表会
- 2013 - University of Cambridge, Churchill College Bill Brown Prize, チャーチルカレッジの工学部の学生の中で最も優れた成績
前のページに戻る