創発システム研究の新たなる展開  強化学習システムの設計指針

木村元; 宮崎和光; 小林重信

文献

J-GLOBAL ID：200902112554978341 整理番号：99A1013533

創発システム研究の新たなる展開強化学習システムの設計指針

The Evolution of Research on Emergent Systems. A Guideline for Designing Reinforcement Learning Systems.

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=99A1013533&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=99A1013533&from=J-GLOBAL&jstjournalNo=F0131A") }}

著者 (3件)： , ,
資料名：
巻： 38 号： 10 ページ： 618-623 発行年： 1999年10月10日
JST資料番号： F0131A ISSN： 0453-4662 CODEN： KESEA 資料種別：逐次刊行物 (A)
記事区分：解説発行国：日本 (JPN) 言語：日本語 (JA)

強化学習の利用価値およびいくつかの理論的知見を紹介し,システ...

,...

続きはJDreamIII（有料）にて {{ this.onShowAbsJLink("http://jdream3.com/lp/jglobal/index.html?docNo=99A1013533&from=J-GLOBAL&jstjournalNo=F0131A") }}

システム最適化手法

引用文献 (22件)：

ABE, N. Learning to Optimally Schedule Internet Banner Advertisements. Proc.of 16th Int.Conf.on Machine Learning. 1999, 12-21
浅田稔. 強化学習の実ロボットへの応用とその課題. 人工知能学会誌. 1997, 12, 6, 831-836
BERTSEKAS, D. P. Neuro-Dynamic Programming. 1996
BRADTKE, S. J. Reinforcement Learning Method for Continuous-Time Markov Decision Problems. Advances in Neural Information Processing Systems. 1994, 7, 393-400
DOYA, K. Efficient Nonlinear Control with Actor-Tutor Architecture. Advances in Neural Information Processing Systems. 1996, 9, 1012-1018

, , , , ,

前のページに戻る

創発システム研究の新たなる展開 強化学習システムの設計指針

創発システム研究の新たなる展開強化学習システムの設計指針