抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習(RL)における自律学習の必要性を目指して,内発的動機づけとして心理的情動因子を導入することにより提案した定量的感情に基づく動機づけモデル。好奇心を用いた促進または未知状態のエージェントの探査を抑制する,幸福指数は電流状態-行動の幸福レベルを決定するために使用される,制御力は,その周辺環境におけるエージェントの制御能力を示し,エージェントの学習選好と行動パターンを調整するために共にに使用された。古典的RLを持つ固有感情的動機を結合するために,二つの方法を提案した。第一の方法は,未知の環境を探索し,時間前方の環境移行モデルを学習するために固有の感情的動機を用いることであり,一方,第二の方法は極限接合報酬関数として外部報酬をもつ固有感情的動機を結合するために,直接エージェントの学習を駆動した。結果が示すように,迷路シナリオにおけるラットの採餌におけるシミュレーション実験で,両方法は比較的良好な性能,外部報酬で駆動される純粋な古典的RLと比較して達成した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】