強化学習の最近の発展《第6回》逆強化学習によるマルチエージェント系の報酬設定

荒井幸代

文献

J-GLOBAL ID：201302212895024009 整理番号：13A1053835

強化学習の最近の発展《第6回》逆強化学習によるマルチエージェント系の報酬設定

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=13A1053835&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=13A1053835&from=J-GLOBAL&jstjournalNo=F0131A") }}

著者 (1件)：
資料名：
巻： 52 号： 6 ページ： 534-539 発行年： 2013年06月10日
JST資料番号： F0131A ISSN： 0453-4662 CODEN： KESEA 資料種別：逐次刊行物 (A)
記事区分：解説発行国：日本 (JPN) 言語：日本語 (JA)

スマートグリッド,グリッドコンピューティング,高度交通システムおよびセンサーネットワークなど,複数の自律的なエージェントから構成されるシステムの知的振舞いを実現する技術への要請は大きい。マルチエージェントによるモデリングが自然であるが,前記のネットワークにおける各エージェントは,個々の目標を持ち自己の利益を優先する点を考慮して,行動ルールを設計しなければならない。本稿では,報酬設定という視点から初期の代表的な2つの逆強化学習アルゴリズムを整理し,各方法のマルチエージェント系への適用例を示すことを通じて,マルチエージェント系の報酬設定問題を考察する。

, , , , , ,
, ,

人工知能

引用文献 (18件)：

SUTTON, Richard S. Reinforcement Learning : An Introduction. 1998
木村元. 強化学習システムの設計指針. 計測と制御. 1999, 38, 10, 618-623
RUSSELL, S. Learning Agents for Uncertain Environments(extended abstract). Proc. of 16th International Conference on Machine Learning, 1998. 1998, 278-287
NG, A. Algorithms for Inverse Reinforcement Learning. Proc. of 17th International Conference on Machine Learning, 2000. 2000, 663-670
ABBEEL, P. Apprenticeship Learning via Inverse Reinforcement Learning. Proc. of 21st International Conference on Machine Learning, 2004. 2004, 1-8

, , , ,

前のページに戻る