不確定システムのための適応観測ベースの効率的な強化学習【JST・京大機械翻訳】

Ran Maopeng; Xie Lihua

プレプリント

J-GLOBAL ID：202202205555919390 整理番号：22P0212152

不確定システムのための適応観測ベースの効率的な強化学習【JST・京大機械翻訳】

Adaptive Observation-Based Efficient Reinforcement Learning for Uncertain Systems

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2020年11月23日プレプリントサーバーでの情報更新日： 2020年11月23日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

本論文では,不確かなドリフト動力学を持つシステムのための適応観測ベース効率的な強化学習(RL)アプローチを開発した。新しい同時学習適応拡張オブザーバ(CL-AEO)を最初に設計し,システム状態とパラメータを同時に推定した。このオブザーバは2時間スケール構造を持ち,状態導関数情報を計算する追加の数値技術を必要としない。同時学習(CL)のアイデアは,記録されたデータの利用に活用され,パラメータ推定の収束のための緩和された検証可能な励起条件をもたらす。CL-AEOによって提供される推定状態とパラメータに基づいて,経験ベースのRL方式のシミュレーションを開発し,最適制御政策をオンラインで近似した。厳密な理論解析を与え,システム状態の原点への実用的収束と理想的最適政策に対する開発政策を,励起(PE)条件の持続性なしで達成できることを示した。最後に,開発した方法論の有効性と優位性を比較シミュレーションにより実証した。【JST・京大機械翻訳】

, , , , , , , , , , ,
, , , 【Automatic Indexing@JST】

人工知能

, , ,

前のページに戻る