グリッドベース地図誤差に基づく好奇心を内部報酬とする強化学習

田中芳典; 石川眞澄

文献

J-GLOBAL ID：200902233720104950 整理番号：09A0419907

グリッドベース地図誤差に基づく好奇心を内部報酬とする強化学習

Reinforcement Learning with Internal Rewards Based on Error in a Grid-based Map

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=09A0419907&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=09A0419907&from=J-GLOBAL&jstjournalNo=S0532B") }}

著者 (2件)： ,
資料名：
巻： 108 号： 480(NC2008 103-175) ページ： 285-290 発行年： 2009年03月04日
JST資料番号： S0532B ISSN： 0913-5685 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

ゴールまでの最適行動を強化学習によって求めるという課題に対し,ゴール到達時の環境からの外部報酬に加えて,好奇心を内部報酬とすることにより,強化学習を効率化することを目的とする。ここで予測誤差の減少により好奇心を定義し,センサー情報から推定したグリッドベース地図と,各グリッドでのセンサー情報との差を予測誤差と定義する。シミュレーション実験の結果,強化学習と比較して過渡状態におけるゴール回数や行動回数に関して性能の向上が見られた。併せて,提案手法で用いた各パラメータ値が行動獲得や環境学習に与える影響についても検討した。(著者抄録)

, , , , , , , , , , ,
, , , ,

人工知能

引用文献 (4件)：

OUDEYER, P. Y. Intrinsic motivation systems for au-tonomous mental development. IEEE Transactions on Evolutionary Computation. 2007, 265-286
OUDEYER, P. Y. The Discovery of Communication Sony Computer Science Lab
OUDEYER, P. Y. Intelligent Adaptive Curiosity : a source of Self-Development. Proceedings of the Fourth International Workshop on Epigenetic Robotics, 2004. 2004
山本尚幸. 内発的動機付けを用いた移動ロボットの行動計画. 電子情報通信学会技術研究報告. 2008, 107, 542, 301-306

, , , , ,

前のページに戻る