リスクから学んだ方法:効率的で安全な運転戦略のための明示的リスク-効用強化学習【JST・京大機械翻訳】

Schmidt Lukas M.; Rietsch Sebastian; Plinge Axel; Eskofier Bjoern M.; Mutschler Christopher

プレプリント

J-GLOBAL ID：202202218783643952 整理番号：22P0305059

リスクから学んだ方法:効率的で安全な運転戦略のための明示的リスク-効用強化学習【JST・京大機械翻訳】

How to Learn from Risk: Explicit Risk-Utility Reinforcement Learning for Efficient and Safe Driving Strategies

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2022年03月16日プレプリントサーバーでの情報更新日： 2022年08月02日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

自律運転は,移動性を革命する可能性があり,従って,研究の活発な分野である。実際に,自律車両の挙動は,許容できる,すなわち,効率的で,安全で,解釈できる。バニラ強化学習(RL)は,実行行動戦略を見つけるが,それらはしばしば不安全であり,解釈不能である。安全はSafe RLアプローチを通して導入されるが,まだ学習された行動が,それらを別々にモデル化することなく,安全性と性能のために共同最適化されるので,まだ解釈できないままである。テーブル間機械学習は,RLにほとんど適用されない。本論文では,SafeDQNを提案し,自律車両の行動を安全で解釈できるが,まだ効率的である。SafeDQNは,予測リスクと行動の効用の間の理解可能な意味的トレードオフを提供し,一方,アルゴリズム的に透明である。SafeDQNは様々なシナリオに対して解釈可能かつ安全な運転政策を見出し,最先端の顕著性技術がリスクと有用性の両方を評価するのに役立つことを示した。【JST・京大機械翻訳】

, , , , , , ,
, , 【Automatic Indexing@JST】

人工知能 , ロボットの運動・制御

, , ,

前のページに戻る