抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・Tyalorらの提案した強化学習における転移学習をもとに,いくつかの方策再利用法を議論し,計算機実験からそれらの効果を検証。
・実験結果から,知識複写では負の転移が発現し,Target taskの最適解探査に時間を要したが,時間は要するが環境適応出来ていると言えることを記述。
・知識修正では,Target taskにおけるSource taskの最短経路を妨害する障害物にエージェントが衝突し続けてデッドロックし,明らかに負の転移となったが,手法を修正し,障害物衝突時はエージェントに負の報酬を与えることで,デッドロックを回避し,さらには正の転移が発現。