抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習を応用した転移学習では,エージェントがさまざまなタスクを学習することを通して,自ら獲得した知識を蓄積し利用することによって,他の類似したタスクでの学習を効率化できる。多くのタスクを学習し,多くの知識を保持している方が有利と思われるが,一方,知識量が多いということは,計算量の増加や多くのメモリを消費するなど負の影響もある。本研究では,連続状態を扱うマルチタスク下での強化学習問題において,状態価値を用いて有効性の少ない知識を削減する手法を提案した。6リンクの多関節ロボット場合,学習時間が1/9程度に短縮され,タスク達成率は10%以上向上した。