文献
J-GLOBAL ID:202202240111032318   整理番号:22A1079882

深層強化学習を用いたサッカータスクにおける組織的な守備の獲得

著者 (4件):
資料名:
巻: 121  号: 382(AI2021 12-25)  ページ: 71-76 (WEB ONLY)  発行年: 2022年02月21日 
JST資料番号: U2030A  ISSN: 2432-6380  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本研究では深層強化学習を用いてサッカータスクのディフェンスにおける協調行動の獲得を目指す.その中で特にカリキュラム学習を利用する.カリキュラム学習は段階的に学習を行う手法であり,難しいタスクの学習に利用される.カリキュラムの設計によって協調行動が獲得できると考え協調行動に対する直接的な報酬は与えずに獲得を試みた.最終的にオフェンス1体,ディフェンス2体の環境で実験を行い,カリキュラム学習を用いた場合が用いなかった場合よりも高い報酬を獲得し,効率的に学習が進んだ.しかし協調行動の獲得は進まなかった.このことからカリキュラム学習がサッカータスクのディフェンスの効率的な学習には有効であるが,協調行動の獲得には協調行動に対する直接的な報酬が必要であることがわかった.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
引用文献 (9件):
  • D. Silver, A. Huang, C.J. Maddison, A. Guez, L. Sifre, G. van den-Driessche, J. Schrittwieser, I. Antonoglou, V. Panneershelvam, M. Lanctot, S. Dieleman, D. Grewe, J. Nham, N. Kalchbrenner, I. Sutskever, T. Lillicrap, M. Leach, K. Kavukcuoglu, T. Graepel, and D. Hassabis, “Mastering the game of go with deep neural networks and tree search,” Nature, vol.529, no.7587, pp.484-489, Jan. 2016. https://doi.org/10.1038/nature16961
  • D. Silver, T. Hubert, J. Schrittwieser, I. Antonoglou, M. Lai, A. Guez, M. Lanctot, L. Sifre, D. Kumaran, T. Graepel, T. Lillicrap, K. Simonyan, and D. Hassabis, “A general reinforcement learning algorithm that masters chess, shogi, and go through self-play,” Science, vol.362, no.6419, pp.1140-1144, 2018. https://www.science.org/doi/abs/10.1126/science.aar6404
  • 阿部宇志,折原良平,清 雄一,田原康之,大須賀昭彦,“サッカータスクの協調行動獲得におけるカリキュラム学習を用いた強化学習,” 信学技報,vol.120,pp.79-84,Feb. 2021.AI2020-37.
  • P. Stone, R.S. Sutton, and G. Kuhlmann, “Reinforcement learning for RoboCup-soccer keepaway,” Adaptive Behavior, vol.13, no.3, pp.165-188, 2005.
  • S. Kalyanakrishnan, Y. Liu, and P. Stone, “Half field offence in robocup soccer: A multiagent reinforcement learning case study,” RoboCup 2006: RoboCup Soccer World Cup X, ed. by Springer-Verlag, pp.72-85, 2007.
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る