抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自律車両のための安全で人間のような意思決定システムの設計は,挑戦的なタスクである。創造的模倣学習は,実世界と模擬決定の両方を活用することによって,政策構築を自動化するための一つの可能なアプローチである。自律運転政策への生成模倣学習を適用する以前の研究は,簡単な設定のための低レベル制御器の学習に焦点を合わせている。しかしながら,複雑な設定にスケールするために,多くの自律駆動システムは,適切なタスクと関連コントローラを選択する高レベル意思決定論理と固定,安全,最適化ベースの低レベルコントローラを結合する。本論文では,低水準の運転データをポリシーに模倣する方法で,低レベル制御器インスタンスの集合から選択する高レベルポリシーを学習する方法である,安全-ハードウェア階層広告学習(SHAIL)を採用することによって,このギャップを複雑性に橋渡しすることを試みた。相互作用データセットからの実データを用いて,非ego車両を制御する都市ラウンドアバウトシミュレータを導入した。次に,単純な制御器オプションでも,この手法は,複雑な環境に対してスケーリングが困難な運転者模倣における以前のアプローチよりも,より良い挙動を生成できることを経験的に実証した。著者らの実装はhttps://github.com/sisl/InteractionImitationで利用可能である。【JST・京大機械翻訳】