筋肉ロボットを用いたスクラッチからのテーブルテニスの学習【JST・京大機械翻訳】

Buechler Dieter; Guist Simon; Calandra Roberto; Berenz Vincent; Scholkopf Bernhard; Peters Jan

プレプリント

J-GLOBAL ID：202202217777377624 整理番号：22P0157600

筋肉ロボットを用いたスクラッチからのテーブルテニスの学習【JST・京大機械翻訳】

Learning to Play Table Tennis From Scratch using Muscular Robots

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (6件)： , , , , ,
資料名：
発行年： 2020年06月10日プレプリントサーバーでの情報更新日： 2020年06月10日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

テーブルテニスのような動的タスクは,人間にとって学習するのが比較的容易であるが,ロボットにとって大きな課題を提起する。このようなタスクは,飛行球とロボットの不正確な状態推定の存在下で高速運動と正確なタイミングの正確な制御を必要とする。強化学習(RL)は,データから複雑な制御タスクの学習において有望であることを示した。しかし,実際のシステムに関する動的タスクへのステップベースRLの適用は,RLが高速レジームにおいて何百万の時間ステップを安全に探索し,失敗することを必要とするので,安全クリティカルである。本論文では,モデルフリー強化学習を用いたテーブルテニスの安全な学習を,空気圧人工筋肉(PAM)により駆動されるロボットアームを用いて達成できることを示した。PAMの柔らかさとバックドリビビリティ特性は,その状態空間の安全な領域を残すことからシステムを防ぐ。この方法で,RLはロボットを5m・sと12m・sの実ボールを,所望の着陸点に平均で戻す。著者らの設定は,エージェントが,アルゴリズムにおける安全制約なしで,この安全限界タスク(i)を学習することを可能にし,(ii)実際のシステムの低レベル制御に直接作用する確率的ポリシーと(iv)事前知識なしでのスクラッチから数千の試行(v)の列車を,直接,報酬関数(iii)で,直接返送したボールの速度を最大化することを可能にした。さらに,シミュレーションで記録されたボール軌跡をランダム再生し,実際のロボットに動作を適用することにより,訓練中に実際のボールを演ずる実用的なハイブリッドsimと実際の訓練であるHYSRを提案した。本研究は,(a)人間形態ロボットアームを用いた安全クリティカルな動的タスクの失敗安全学習であり,(b)は,制御課題と(c)訓練ロボットが実際のボールなしでテーブルテニスを演ずるにもかかわらず,PAM駆動システムによる精度要求問題を学習する。ビデオとデータセットは,筋TT.塞栓.mlで利用可能である。【JST・京大機械翻訳】

, , , , , , , , , , , ,
, , , 【Automatic Indexing@JST】

ロボットの運動・制御 , 人工知能

, , , ,

前のページに戻る