プレプリント
J-GLOBAL ID:202202201376278492   整理番号:22P0286569

強化学習における3D回転のためのBinghamポリシーパラメタリゼーション【JST・京大機械翻訳】

Bingham Policy Parameterization for 3D Rotations in Reinforcement Learning
著者 (2件):
資料名:
発行年: 2022年02月08日  プレプリントサーバーでの情報更新日: 2022年02月08日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習中の3D回転を表現するための新しい政策パラメタリゼーションを提案した。連続制御強化学習文献において,多くの確率的政策パラメタリゼーションはGaussである。Gauss政策パラメタリゼーションの普遍的適用は,全ての環境に対して必ずしも望ましいとは限らない。このような事例は,特に,完全6D姿勢出力の一部として,分離,あるいは,並進と結合した3D回転出力の予測を含むタスクである。提案したBinghamポリシーパラメータ化(BPP)は,Bingham分布をモデル化し,一連の強化学習タスクにおけるGaussポリシーパラメータ化に対するより良い回転(四級化)予測を可能にする。回転Wahba問題タスクに関するBPPと,RLBenchからの視覚ベースの次のベスト姿勢ロボットマニピュレーションタスクのセットを評価した。本論文は,Gaussを常に仮定するよりも,特定の環境に適した他の政策パラメタリゼーションの開発へのより多くの研究を奨励することを期待する。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  ロボットの運動・制御 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る