文献
J-GLOBAL ID:201302292938270045   整理番号:13A0291840

実際に連続動作を伴うモデルフリーの強化学習

Model-Free Reinforcement Learning with Continuous Action in Practice
著者 (3件):
資料名:
巻: 2012 Vol.3  ページ: 2177-2182  発行年: 2012年 
JST資料番号: B0982A  ISSN: 0743-1619  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,既存の適格性トレースを有する方策勾配アルゴリズムと勾配非対称技術を拡張した。ロボット工学においては,環境の変化に対してリアルタイムで挙動を変化させることが求められるが,実際にはロボットのリアルタイム学習に強化学習を適用することは難しい。ロボット工学では動作が連続であることが多いが,その大部分の作業が離散的動作に関する強化学習では計り知れないものとなる。著者らは連続動作を含むロボット作業に関して,既存と新規のアルゴリズムの実証的研究を行った。適格性トレースと勾配スケーリングの導入は性能を改善した。最終的に連続動作と予期せぬ環境変化を追跡する状態空間を有するリアルタイム学習には,俳優-批評家アルゴリズムが実用的であることを実証した。
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
ロボットの運動・制御 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る