抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
決定論的離散時間線形システムの最適密度制御のエントロピー正則化バージョンを考察した。最適制御のためのエントロピー正則化または最大エントロピー(MaxEnt)法は,特に自然探査戦略のような多くの利点のために,強化学習において多くの注目を引きつけた。メリットにもかかわらず,正則化によって誘起された高エントロピー制御政策は,システムへの確率的不確実性を導入し,それは,安全クリティカルシステムに対するMaxEnt最適制御の適用性を厳しく制限する。この状況を改善するために,著者らは,状態不確実性を直接制御するために,MaxEnt最適制御に特定の時間でGauss密度制約を課した。特に,MaxEnt最適密度制御の陽形式を導いた。さらに,密度制約が固定点制約によって置換される場合も考察した。次に,線形系に対するBrownブリッジの一般化であるピン止めプロセスとして,関連する状態プロセスを特性化した。最後に,MaxEnt最適密度制御が,離散時間線形系に関連したいわゆるSchr「odingerブリッジ」を与えることを明らかにした。【JST・京大機械翻訳】