抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自然方策勾配法などの強化学習の成功には,適切な学習率の設定が不可欠である。確率的勾配法の適応的学習率として提案されたImportance weight aware update(IWAU)は,パラメータに対して線形な関数近似器の学習において,パラメータの更新が停留点を越えないこと(safety)を保証し,さらに学習率のメタパラメータを設定する必要がない。特に,二乗損失を利用する場合,IWAUは簡潔な形式で表現できる。本研究では,自然方策勾配の推定が,線形回帰と二乗損失の最小化として記述できることに着目して,safetyを満たし,かつチューニングの必要ない新たな適応的学習率を提案する。提案手法を古典的なベンチマーク課題に適用し,有用性を確認する。(著者抄録)