研究者
J-GLOBAL ID:201301084954588726   更新日: 2020年07月13日

内部 英治

ウチベ エイジ | Uchibe Eiji
所属機関・部署:
職名: 主幹研究員
ホームページURL (2件): https://bicr.atr.jp/bri/http://www.cns.atr.jp/bri/en/
研究分野 (3件): 知能情報学 ,  知能ロボティクス ,  知覚情報処理
研究キーワード (2件): ロボティクス ,  強化学習
競争的資金等の研究課題 (6件):
  • 2019 - 2021 モデルフリーとモデルベースの協同による深層並列強化学習
  • 2017 - 2019 並列深層強化学習
  • 2016 - 2019 カルバックライブラー制御法と内的報酬を統合した強化学習
  • 2014 - 2016 部分観測環境下におけるモデルベース・モデルフリー強化学習の役割分担
  • 2012 - 2015 強化学習のための情報理論に基づく報酬の設計論
全件表示
論文 (41件):
  • Tadashi Kozuno, Eiji Uchibe, Kenji Doya. Theoretical Analysis of Efficiency and Robustness of Softmax and Gap-Increasing Operators in Reinforcement Learning. Proc. of 22nd International Conference on Artificial Intelligence and Statistics. 2019
  • Y. Tsurumine, Y. Cui, E. Uchibe, T. Matsubara. Deep reinforcement learning with smooth policy update: Application to robotic cloth manipulation. Robotics and Autonomous Systems. 2019. 112. 72-83
  • Stefan Elfwing, Eiji Uchibe, Kenji Doya. Sigmoid-weighted linear units for neural network function approximation in reinforcement learning. Neural Networks. 2018. 107. 3-11
  • Eiji Uchibe. Cooperative and Competitive Reinforcement and Imitation Learning for a Mixture of Heterogeneous Learning Modules. Frontiers in Neurorobotics. 2018
  • Jiexin Wang, Stefan Elfwing, Eiji Uchibe. Deep reinforcement learning by parallelizing reward and punishment using MaxPain architecture. Proc. of the 8th Joint IEEE International Conference on Development and Learning and on Epigenetic Robotics. 2018
もっと見る
MISC (9件):
  • 内部英治. エントロピ正則された強化学習を用いた模倣学習. 第33回日本人工知能学会全国大会. 2019
  • Eiji Uchibe, Jiexin Wang. EM-based policy search for learning foraging and mating behaviors. ロボティクス・メカトロニクス講演会. 2018
  • 内部英治. 方策探査法のための多重重点サンプリングを用いた経験再利用. ロボティクス・メカトロニクス講演会. 2018
  • 鶴峯義久, 崔允端, 内部英治, 松原崇充. 生画像を入力とするサンプル効率の良い深層強化学習と双腕ロボットによる布操作への応用. 日本ロボット学会学術講演会予稿集(CD-ROM). 2017. 35th. ROMBUNNO.3I3-01
  • 鶴峯義久, CUI Y, 松原崇充, 内部英治, 杉本謙二. 動的方策計画に基づく深層強化学習. 計測自動制御学会制御部門マルチシンポジウム(CD-ROM). 2017. 4th. ROMBUNNO.PS-16
もっと見る
特許 (4件):
講演・口頭発表等 (13件):
  • Imitation learning under entropy regularization
    (Reinforcement Learning & Biological Intelligence 2019)
  • 行動から報酬を推定する逆強化学習
    (次世代脳プロジェクト冬のシンポジウム 2018)
  • Forward and inverse reinforcement learning and generative adversarial formulation
    (ニューロコンピューティング研究会 2018)
  • Deep inverse reinforcement learning
    (The Third International Workshop on Intrinsically Motivated Open-ended learning 2017)
  • ディープNNによる順・逆強化学習
    (第27回日本神経回路学会全国大会 2017)
もっと見る
学位 (1件):
  • 博士(工学) (大阪大学大学院)
経歴 (8件):
  • 2015/10 - 現在 国際電気通信基礎技術研究所 主幹研究員
  • 2008/10 - 2015/09 沖縄科学技術大学院大学 グループリーダー
  • 2005/10 - 2008/09 沖縄大学院大学先行的研究事業 グループリーダー
  • 2004/04 - 2005/09 JST 沖縄新大学院大学 先行的研究プロジェクト グループリーダー
  • 2003/05 - 2004/03 国際電気通信基礎技術研究所 研究員
全件表示
所属学会 (3件):
日本神経回路学会 ,  日本ロボット学会 ,  人工知能学会
※ J-GLOBALの研究者情報は、researchmapの登録情報に基づき表示しています。 登録・更新については、こちらをご覧ください。

前のページに戻る