文献
J-GLOBAL ID:201302212895024009   整理番号:13A1053835

強化学習の最近の発展《第6回》逆強化学習によるマルチエージェント系の報酬設定

著者 (1件):
資料名:
巻: 52  号:ページ: 534-539  発行年: 2013年06月10日 
JST資料番号: F0131A  ISSN: 0453-4662  CODEN: KESEA  資料種別: 逐次刊行物 (A)
記事区分: 解説  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
スマートグリッド,グリッドコンピューティング,高度交通システムおよびセンサーネットワークなど,複数の自律的なエージェントから構成されるシステムの知的振舞いを実現する技術への要請は大きい。マルチエージェントによるモデリングが自然であるが,前記のネットワークにおける各エージェントは,個々の目標を持ち自己の利益を優先する点を考慮して,行動ルールを設計しなければならない。本稿では,報酬設定という視点から初期の代表的な2つの逆強化学習アルゴリズムを整理し,各方法のマルチエージェント系への適用例を示すことを通じて,マルチエージェント系の報酬設定問題を考察する。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
引用文献 (18件):
  • SUTTON, Richard S. Reinforcement Learning : An Introduction. 1998
  • 木村元. 強化学習システムの設計指針. 計測と制御. 1999, 38, 10, 618-623
  • RUSSELL, S. Learning Agents for Uncertain Environments(extended abstract). Proc. of 16th International Conference on Machine Learning, 1998. 1998, 278-287
  • NG, A. Algorithms for Inverse Reinforcement Learning. Proc. of 17th International Conference on Machine Learning, 2000. 2000, 663-670
  • ABBEEL, P. Apprenticeship Learning via Inverse Reinforcement Learning. Proc. of 21st International Conference on Machine Learning, 2004. 2004, 1-8
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る