文献
J-GLOBAL ID:202202220373962733   整理番号:22A0878242

連続空間での深層強化学習による羊の群れのハーディングに関する基礎検討

A Basic Study on Herding a Flock of Sheep through Deep Reinforcement Learning in a Continuous Space
著者 (3件):
資料名:
巻: 142  号:ページ: 149-150(J-STAGE)  発行年: 2022年 
JST資料番号: S0810A  ISSN: 0385-4221  資料種別: 逐次刊行物 (A)
記事区分: 短報  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Strombomらは,牧羊犬が羊の群れを巧みに制御し,目的地に誘導するアルゴリズムを明らかにした。これはHerdingアルゴリズムと呼ばれ,2つの方法,すなわち,羊の群れを目的地に誘導する「driving」と,羊を1つの群れに集める「collecting」で,牧羊犬の行動をモデル化する。このモデルにおいて,Goらは,エージェント(牧羊犬)が,強化学習(RL)によって生成された推論モデルによって羊の群れを集め得ることを示した。しかし,以前の研究では,RLは,離散化された環境状態と行動空間において,エージェントが「driving」と「collecting」を行う位置への移動行動のみを学習した。本研究では,連続環境状態と行動空間を想定した。著者らは,エージェントのハーディング行動が学習目標であるとしても,深層RLによって生成された提案推論モデルは羊をハーディングできることを確認した。(翻訳著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
羊,山羊  ,  人工知能 
引用文献 (3件):
  • (1) D. Strömbom, R. P. Mann, A. M. Wilson, S. Hailes, A. J. Morton, D. J. T. Sumpter, and A. J. King: “Solving the shepherding problem: heuristics for herding autonomous, interacting agents”, J. R. Soc. Interface, Vol. 11, Issue 100 (2014)
  • (2) C. K. Go, B. Lao, J. Yoshimoto, and K. Ikeda: “A reinforcement learning approach to the shepherding task using SARSA”, 2016 Int'l Joint Conf. Neural Networks, pp. 3833-3836, Vancouver, BC, Canada (2016)
  • (3) J. Schulman, F. Wolski, P. Dhariwal, A. Radford, and O. Klimov: “Proximal policy optimization algorithms”, Computing Research Repository (2017)
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る