文献
J-GLOBAL ID:201802238539633587   整理番号:18A1943592

異なる挙動を持つ自律運転のための深層階層強化学習【JST・京大機械翻訳】

Deep Hierarchical Reinforcement Learning for Autonomous Driving with Distinct Behaviors
著者 (3件):
資料名:
巻: 2018  号: IV  ページ: 1239-1244  発行年: 2018年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深い強化学習は,生の画素入力からAtariゲームを行う学習のような領域において最近大きな進歩を遂げている。強化学習のモデルフリー特性は,ハンド符号化複合ポリシーから自由になる。しかしながら,自律運転のような実世界タスクに対しては,異なる挙動を含むいくつかの複雑な逐次意思決定プロセスがある。Delid報酬と平均勾配により,平坦な深い強化学習アルゴリズムが良い政策を学習するのは困難である。本論文では,階層的ニューラルネットワークポリシーを設計し,半Markov決定プロセス(SMDP)時間抽象定式化によりネットワークを訓練するための階層的ポリシー勾配法を提案した。この方法を自律運転における交通光通過シナリオに適用した。そこでは,車両は2つの異なる挙動(例えば,通過と停止)を持ち,その基本的行動(例えば加速度)は対応する挙動に従うべきである。シミュレーションにより,この方法が正しい決定を選択でき,トラヒック光が黄色になると適切に動作することを示した。反対に,平坦な強化学習アルゴリズムは良好な性能を達成できず,大きな分散を示した。さらに,訓練されたニューラルネットワークモジュールは,将来,より多くのシナリオをカバーするために再利用可能である。Copyright 2018 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る