文献
J-GLOBAL ID:202002227038085081   整理番号:20A2769621

安全なMeta模倣学習のためのタスク不確実性のモデリング【JST・京大機械翻訳】

Modeling Task Uncertainty for Safe Meta-Imitation Learning
著者 (6件):
資料名:
巻:ページ: 606361  発行年: 2020年 
JST資料番号: U7099A  ISSN: 2296-9144  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: スイス (CHE)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多様な複雑な環境において広範囲のタスクを実行するための柔軟性を有するロボットを付与するために,経験データからのそれらの制御装置の学習は有望なアプローチである。特に,いくつかの最近のメタラーニング法は,訓練中に他のタスクを実行する経験を活用することによって,新しいタスクを解決することを示した。ロボット制御のメタ学習に関する研究が性能の改善に働いているが,安全問題は十分に調査されておらず,それはまた,展開における重要な考慮事項である。本論文では,まず,視覚模倣のメタ学習における安全とタスク推論に関する不確実性を関連させ,次に,PETNetと呼ばれるタスク埋込み空間における確率的推論を通してタスク不確実性を推定するための新しいフレームワークを提案した。タスク推定に関するタスク性能と不確実性評価に関して,シミュレーションロボットアームを用いた操作タスクでPETNetを検証した。メタイミテーション学習における標準ベンチマーク手順に従って,PETNetは以前の方法と同じまたはより高いレベルの性能(メタテスト時間における新しいタスクの成功率)を達成できることを示した。さらに,意味的に不適当または合成外出実証によるPETNetテストにより,PETNetは,与えられた実証に固有のタスクに関する不確実性を捉える能力を示し,ロボットが制御装置が適切に機能しない状況を同定することができる。これらの結果は,著者らの提案が,多様なタスクと環境へのロボット学習システムの安全な展開に向けた重要なステップを取ることを示した。Copyright 2020 The Author(s) All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
ロボットの運動・制御 
引用文献 (45件):
  • AjayA.KumarA.AgrawalP.LevineS.NachumO. (2020). OPAL: offline primitive discovery for accelerating offline reinforcement learning. arXiv 2010.13611.
  • ArgallB. D.ChernovaS.VelosoM.BrowningB. (2009). A survey of robot learning from demonstration. Robot. Auton. Syst. 57, 469-483. doi: 10.1016/j.robot.2008.10.024
  • DevlinJ.ChangM.-W.LeeK.ToutanovaK. (2019). “BERT: pre-training of deep bidirectional transformers for language understanding,” in Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Minneapolis, MN: Long and Short Papers), 4171-4186.
  • DuanY.SchulmanJ.ChenX.BartlettP. L.SutskeverI.AbbeelP. (2016). RL2: fast reinforcement learning via slow reinforcement learning. arXiv 1611.02779.
  • FinnC.AbbeelP.LevineS. (2017a). “Model-agnostic meta-learning for fast adaptation of deep networks,” in International Conference on Machine Learning (Sydney, NSW).
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る