文献
J-GLOBAL ID:202102230171011099   整理番号:21A0671893

ロボット把持のためのNo-Regret Shannonエントロピー正則化ニューラル文脈バンディットオンライン学習【JST・京大機械翻訳】

No-Regret Shannon Entropy Regularized Neural Contextual Bandit Online Learning for Robotic Grasping
著者 (5件):
資料名:
巻: 2020  号: IROS  ページ: 9620-9625  発行年: 2020年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,報酬推定子としてニューラルネットワークを採用し,Shannonエントロピー正則化を利用して,Shannonエントロピー正則化ニューラル文脈バンド(SERN)と呼ばれる探索を奨励する,新しい文脈的帯域アルゴリズムを提案した。ロボット把持のための多くの学習ベースアルゴリズムにおいて,実世界データの欠如はモデルの一般化性能を妨げ,訓練されたモデルを実世界問題に適用するのを困難にする。この問題を処理するために,提案方法はオンライン学習の利点を利用する。提案方法は,把持品質と呼ばれる深さ画像に基づく与えられた把持姿勢の成功確率を予測するために,ニューラルネットワークを訓練する。SERNはレグレット特性を持たないことを理論的に示した。SERNは,サンプル効率に関してε-欲張りより優れていることを経験的に実証した。Copyright 2021 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 

前のページに戻る