文献
J-GLOBAL ID:202002211794821067   整理番号:20A2354280

ファジィ制御ルールにより表現された方策を持つ方策勾配法:自動車の速度制御問題への適用

Policy Gradient Reinforcement Learning for Policy Represented by Fuzzy Rules: Application to Simulations on Speed Control of an Automobile
著者 (2件):
資料名:
巻: 32  号:ページ: 801-810(J-STAGE)  発行年: 2020年08月15日 
JST資料番号: L0501A  ISSN: 1347-7986  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ファジィ制御ルールによる行動決定のための方策の表現と方策勾配法による強化学習とを融合し,ファジィ制御ルールにおけるルール重みをエピソードあたりの報酬の期待値が極大となるように学習する方式が提案されている.この融合方式が自動車の速度制御の問題へ適用された研究例では,得られた結果の中に良好な解が見つかった一方,速度の望ましくない変動を生じる解も多く含まれていた.一般に,出力値に急な時間変化や振動をもたらす方策は望ましくなく,時間的に滑らかな出力値を与える方策が望ましい事例は多数考えられる.そこで本研究では,学習結果における出力値の急な変動を抑制するための改善策として,重心モデルによる非ファジィ化と時間に関する滑らか拘束項とを導入した目的関数を提案し,この融合方式に関してその場合の学習則を示す.さらに,報酬の与え方による出力値の変動に対する影響についても検討する.自動車の速度制御問題への適用実験の結果,提案した改善法について,出力値の望ましくない時間変動を抑制する効果があることを確認した.報酬関数については,設計の仕方によって学習の結果に悪影響が出る場合のあることを確認した.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (4件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  システム・制御理論一般  ,  制御工学一般  ,  その他のオペレーションズリサーチの手法 
引用文献 (17件):
もっと見る

前のページに戻る