抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
状態と作用した連続強化学習環境内の固有報酬としてのエンパワーメントを使用するより実用的な方法を提案した。著者らの方法はこの二種のアイデアに基づき,i)エンパワーメントの新しいBellmanのような方程式を利用し,ii)連続状態と行動上の複雑な分布の近似を避けることにより局所報酬の計算を単純化した。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】