文献
J-GLOBAL ID:202202233780070136   整理番号:22A0772126

擬似エピソード物理環境における自律学習【JST・京大機械翻訳】

Autonomous Learning in a Pseudo-Episodic Physical Environment
著者 (2件):
資料名:
巻: 104  号:ページ: 32  発行年: 2022年 
JST資料番号: T0752A  ISSN: 0921-0296  CODEN: JIRSES  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
実際的考察強化学習は,物理実験に適用した場合,シミュレーションの外で困難なタスクであることが証明されている。ここでは,慎重な実験設計とアルゴリズム意思決定を通して,完全にオンラインで達成される自由強化学習をモデル化するためのオプションアプローチを導いた。不安定な1次元機械環境に対して伝統的にエピソードアルゴリズムを実装するための強化学習スキームを設計した。訓練スキームは完全に自律的であり,学習過程を通して人間が存在しなかった。著者らは,擬似等値技術が,オフポリシーアクター-批判と経験再生方式による追加学習更新を可能にすることを示した。伝統的な訓練エピソードの期間のこれらの追加更新を含めることは,学習の速度と一貫性を改善できることを示す。さらに,実験ハードウェアにおける手順を検証した。物理的環境において,いくつかのアルゴリズムバリアントは急速に学習し,それぞれはベースライン最大報酬を凌駕する。本研究のアルゴリズムはモデルフリーであり,訓練中のオンボードセンサにより得られた情報のみを使用する。Copyright The Author(s) 2022 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る