文献
J-GLOBAL ID:201302276357430542   整理番号:13A0291710

方策勾配法での分散低減の重要性

The Importance of Variance Reduction in Policy Gradient Method
著者 (2件):
資料名:
巻: 2012 Vol.2  ページ: 1376-1381  発行年: 2012年 
JST資料番号: B0982A  ISSN: 0743-1619  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
補強学習はロボットの運動制御問題に広く応用された。本稿で,著者らは局所基準線と呼ぶ,前の研究の技術を強調し,この技術を加えた成功の理論と数値解析を提供した。勾配の真の期待に基づく最適基準線が数値実証またはロールアウトを要するのと異なり,この局所基準線を,幾つかの資料から直接計算でき,そして方策勾配法(PGM)に基づくアルゴリズムの学習速度を著しく改善できた。本稿の寄与は,著者らが,この技術を持つPGMを保証できる条件を確立し,そしてこの技術を使って学習速度を代表的PGMより常に速いことを証明した,ことであった。著者らはまた,PGMの結果を時には改善できる一般に使われる微調整でこの技術を解析した。そして数値結果は,PGMに局所基準線を加える技術が,学習速度を著しく改善できるだけでなく,また高不確定な動力学下で矛盾の無い結果を生み,そしてこの優れた性能を学習速度の微調整またはパラメータメモリを使って達成できない,ことを暗示した。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
ロボットの運動・制御 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る