内発的動機づけを促進する古典的強化学習としての感情の利用【Powered by NICT】

Lu Cheng-Xiang; Sun Zhi-Yuan; Shi Zhong-Zhi; Cao Bao-Xiang

文献

J-GLOBAL ID：201702230711604997 整理番号：17A0756958

内発的動機づけを促進する古典的強化学習としての感情の利用【Powered by NICT】

Using Emotions as Intrinsic Motivation to Accelerate Classic Reinforcement Learning

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A0756958&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A0756958&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (4件)： , , ,
資料名：
巻： 2016 号： ISAI ページ： 332-337 発行年： 2016年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

強化学習(RL)における自律学習の必要性を目指して,内発的動機づけとして心理的情動因子を導入することにより提案した定量的感情に基づく動機づけモデル。好奇心を用いた促進または未知状態のエージェントの探査を抑制する,幸福指数は電流状態-行動の幸福レベルを決定するために使用される,制御力は,その周辺環境におけるエージェントの制御能力を示し,エージェントの学習選好と行動パターンを調整するために共にに使用された。古典的RLを持つ固有感情的動機を結合するために,二つの方法を提案した。第一の方法は,未知の環境を探索し,時間前方の環境移行モデルを学習するために固有の感情的動機を用いることであり,一方,第二の方法は極限接合報酬関数として外部報酬をもつ固有感情的動機を結合するために,直接エージェントの学習を駆動した。結果が示すように,迷路シナリオにおけるラットの採餌におけるシミュレーション実験で,両方法は比較的良好な性能,外部報酬で駆動される純粋な古典的RLと比較して達成した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】

, , , , ,
, , , , , , , 【Automatic Indexing@JST】

人工知能 , 応用心理学

, , ,

前のページに戻る