文献
J-GLOBAL ID:201802286230650064   整理番号:18A0411139

転移学習における方策再利用法の技法と比較

Comparison of policy reusing mechanisms in transfer reinforcemnet learing
著者 (1件):
資料名:
巻: 40  号: 1 (Dec)  ページ: 79-84 (WEB ONLY)  発行年: 2017年12月25日 
JST資料番号: U0199A  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・Tyalorらの提案した強化学習における転移学習をもとに,いくつかの方策再利用法を議論し,計算機実験からそれらの効果を検証。
・実験結果から,知識複写では負の転移が発現し,Target taskの最適解探査に時間を要したが,時間は要するが環境適応出来ていると言えることを記述。
・知識修正では,Target taskにおけるSource taskの最短経路を妨害する障害物にエージェントが衝突し続けてデッドロックし,明らかに負の転移となったが,手法を修正し,障害物衝突時はエージェントに負の報酬を与えることで,デッドロックを回避し,さらには正の転移が発現。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る