プレプリント
J-GLOBAL ID:202202218783643952   整理番号:22P0305059

リスクから学んだ方法:効率的で安全な運転戦略のための明示的リスク-効用強化学習【JST・京大機械翻訳】

How to Learn from Risk: Explicit Risk-Utility Reinforcement Learning for Efficient and Safe Driving Strategies
著者 (5件):
資料名:
発行年: 2022年03月16日  プレプリントサーバーでの情報更新日: 2022年08月02日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自律運転は,移動性を革命する可能性があり,従って,研究の活発な分野である。実際に,自律車両の挙動は,許容できる,すなわち,効率的で,安全で,解釈できる。バニラ強化学習(RL)は,実行行動戦略を見つけるが,それらはしばしば不安全であり,解釈不能である。安全はSafe RLアプローチを通して導入されるが,まだ学習された行動が,それらを別々にモデル化することなく,安全性と性能のために共同最適化されるので,まだ解釈できないままである。テーブル間機械学習は,RLにほとんど適用されない。本論文では,SafeDQNを提案し,自律車両の行動を安全で解釈できるが,まだ効率的である。SafeDQNは,予測リスクと行動の効用の間の理解可能な意味的トレードオフを提供し,一方,アルゴリズム的に透明である。SafeDQNは様々なシナリオに対して解釈可能かつ安全な運転政策を見出し,最先端の顕著性技術がリスクと有用性の両方を評価するのに役立つことを示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  ロボットの運動・制御 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る