文献
J-GLOBAL ID:202102232425939622   整理番号:21A0671461

オブジェクト分割のための深層敵対強化学習【JST・京大機械翻訳】

Deep Adversarial Reinforcement Learning for Object Disentangling
著者 (4件):
資料名:
巻: 2020  号: IROS  ページ: 5504-5510  発行年: 2020年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
改善された訓練技術と高い計算力を組み合わせた深層学習は,強化学習(RL)の分野における最近の進歩と,手作業のようなロボットRL応用の成功をもたらした。しかし,ほとんどのロボットRLはよく知られた初期状態分布に依存する。しかし,実世界タスクでは,この情報はしばしば利用できない。例えば,廃棄物オブジェクトを解体するとき,ロボットw.r.t.の実位置は,RL政策が訓練された位置に適合しないかもしれない。この問題を解決するために,新しい敵対的強化学習(ARL)フレームワークを提案した。ARLフレームワークは,元のエージェントをステアするよう訓練された敵対者を,困難な状態に対して訓練する。著者らは,その敵対者および敵対者を,それらの敵対者の変化政策に順応させるように訓練する。提案手法は,ロボット制御のためにエンドツーエンドシステムを訓練することにより,訓練からテストシナリオを一般化し,困難なオブジェクトの解きほぐタスクを解決することを示した。KUKA LBR+7-DOFロボットアームを用いた実験により,訓練中に与えられた場合よりも,異なる初期状態から出発する時に,本手法がベースライン法より優れていることを示した。Copyright 2021 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る