安全なMeta模倣学習のためのタスク不確実性のモデリング【JST・京大機械翻訳】

Matsushima Tatsuya; Kondo Naruya; Iwasawa Yusuke; Nasuno Kaoru; Nasuno Kaoru; Matsuo Yutaka

文献

J-GLOBAL ID：202002227038085081 整理番号：20A2769621

安全なMeta模倣学習のためのタスク不確実性のモデリング【JST・京大機械翻訳】

Modeling Task Uncertainty for Safe Meta-Imitation Learning

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=20A2769621&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=20A2769621&from=J-GLOBAL&jstjournalNo=U7099A") }}

著者 (6件)： , , , , ,
資料名：
巻： 7 ページ： 606361 発行年： 2020年
JST資料番号： U7099A ISSN： 2296-9144 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：スイス (CHE) 言語：英語 (EN)

多様な複雑な環境において広範囲のタスクを実行するための柔軟性を有するロボットを付与するために,経験データからのそれらの制御装置の学習は有望なアプローチである。特に,いくつかの最近のメタラーニング法は,訓練中に他のタスクを実行する経験を活用することによって,新しいタスクを解決することを示した。ロボット制御のメタ学習に関する研究が性能の改善に働いているが,安全問題は十分に調査されておらず,それはまた,展開における重要な考慮事項である。本論文では,まず,視覚模倣のメタ学習における安全とタスク推論に関する不確実性を関連させ,次に,PETNetと呼ばれるタスク埋込み空間における確率的推論を通してタスク不確実性を推定するための新しいフレームワークを提案した。タスク推定に関するタスク性能と不確実性評価に関して,シミュレーションロボットアームを用いた操作タスクでPETNetを検証した。メタイミテーション学習における標準ベンチマーク手順に従って,PETNetは以前の方法と同じまたはより高いレベルの性能(メタテスト時間における新しいタスクの成功率)を達成できることを示した。さらに,意味的に不適当または合成外出実証によるPETNetテストにより,PETNetは,与えられた実証に固有のタスクに関する不確実性を捉える能力を示し,ロボットが制御装置が適切に機能しない状況を同定することができる。これらの結果は,著者らの提案が,多様なタスクと環境へのロボット学習システムの安全な展開に向けた重要なステップを取ることを示した。Copyright 2020 The Author(s) All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , , ,
, , , , , , 【Automatic Indexing@JST】

著者キーワード (5件)： , , , ,

ロボットの運動・制御

引用文献 (45件)：

AjayA.KumarA.AgrawalP.LevineS.NachumO. (2020). OPAL: offline primitive discovery for accelerating offline reinforcement learning. arXiv 2010.13611.
ArgallB. D.ChernovaS.VelosoM.BrowningB. (2009). A survey of robot learning from demonstration. Robot. Auton. Syst. 57, 469-483. doi: 10.1016/j.robot.2008.10.024
DevlinJ.ChangM.-W.LeeK.ToutanovaK. (2019). “BERT: pre-training of deep bidirectional transformers for language understanding,” in Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Minneapolis, MN: Long and Short Papers), 4171-4186.
DuanY.SchulmanJ.ChenX.BartlettP. L.SutskeverI.AbbeelP. (2016). RL²: fast reinforcement learning via slow reinforcement learning. arXiv 1611.02779.
FinnC.AbbeelP.LevineS. (2017a). “Model-agnostic meta-learning for fast adaptation of deep networks,” in International Conference on Machine Learning (Sydney, NSW).

, , ,

前のページに戻る