プレプリント
J-GLOBAL ID:202202205555919390   整理番号:22P0212152

不確定システムのための適応観測ベースの効率的な強化学習【JST・京大機械翻訳】

Adaptive Observation-Based Efficient Reinforcement Learning for Uncertain Systems
著者 (2件):
資料名:
発行年: 2020年11月23日  プレプリントサーバーでの情報更新日: 2020年11月23日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,不確かなドリフト動力学を持つシステムのための適応観測ベース効率的な強化学習(RL)アプローチを開発した。新しい同時学習適応拡張オブザーバ(CL-AEO)を最初に設計し,システム状態とパラメータを同時に推定した。このオブザーバは2時間スケール構造を持ち,状態導関数情報を計算する追加の数値技術を必要としない。同時学習(CL)のアイデアは,記録されたデータの利用に活用され,パラメータ推定の収束のための緩和された検証可能な励起条件をもたらす。CL-AEOによって提供される推定状態とパラメータに基づいて,経験ベースのRL方式のシミュレーションを開発し,最適制御政策をオンラインで近似した。厳密な理論解析を与え,システム状態の原点への実用的収束と理想的最適政策に対する開発政策を,励起(PE)条件の持続性なしで達成できることを示した。最後に,開発した方法論の有効性と優位性を比較シミュレーションにより実証した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る