強化学習における3D回転のためのBinghamポリシーパラメタリゼーション【JST・京大機械翻訳】

James Stephen; Abbeel Pieter

プレプリント

J-GLOBAL ID：202202201376278492 整理番号：22P0286569

強化学習における3D回転のためのBinghamポリシーパラメタリゼーション【JST・京大機械翻訳】

Bingham Policy Parameterization for 3D Rotations in Reinforcement Learning

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年02月08日プレプリントサーバーでの情報更新日： 2022年02月08日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

強化学習中の3D回転を表現するための新しい政策パラメタリゼーションを提案した。連続制御強化学習文献において,多くの確率的政策パラメタリゼーションはGaussである。Gauss政策パラメタリゼーションの普遍的適用は,全ての環境に対して必ずしも望ましいとは限らない。このような事例は,特に,完全6D姿勢出力の一部として,分離,あるいは,並進と結合した3D回転出力の予測を含むタスクである。提案したBinghamポリシーパラメータ化(BPP)は,Bingham分布をモデル化し,一連の強化学習タスクにおけるGaussポリシーパラメータ化に対するより良い回転(四級化)予測を可能にする。回転Wahba問題タスクに関するBPPと,RLBenchからの視覚ベースの次のベスト姿勢ロボットマニピュレーションタスクのセットを評価した。本論文は,Gaussを常に仮定するよりも,特定の環境に適した他の政策パラメタリゼーションの開発へのより多くの研究を奨励することを期待する。【JST・京大機械翻訳】

, , , , , , , , ,

人工知能 , ロボットの運動・制御

, ,

前のページに戻る