プレプリント
J-GLOBAL ID:202202217777377624   整理番号:22P0157600

筋肉ロボットを用いたスクラッチからのテーブルテニスの学習【JST・京大機械翻訳】

Learning to Play Table Tennis From Scratch using Muscular Robots
著者 (6件):
資料名:
発行年: 2020年06月10日  プレプリントサーバーでの情報更新日: 2020年06月10日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
テーブルテニスのような動的タスクは,人間にとって学習するのが比較的容易であるが,ロボットにとって大きな課題を提起する。このようなタスクは,飛行球とロボットの不正確な状態推定の存在下で高速運動と正確なタイミングの正確な制御を必要とする。強化学習(RL)は,データから複雑な制御タスクの学習において有望であることを示した。しかし,実際のシステムに関する動的タスクへのステップベースRLの適用は,RLが高速レジームにおいて何百万の時間ステップを安全に探索し,失敗することを必要とするので,安全クリティカルである。本論文では,モデルフリー強化学習を用いたテーブルテニスの安全な学習を,空気圧人工筋肉(PAM)により駆動されるロボットアームを用いて達成できることを示した。PAMの柔らかさとバックドリビビリティ特性は,その状態空間の安全な領域を残すことからシステムを防ぐ。この方法で,RLはロボットを5m・sと12m・sの実ボールを,所望の着陸点に平均で戻す。著者らの設定は,エージェントが,アルゴリズムにおける安全制約なしで,この安全限界タスク(i)を学習することを可能にし,(ii)実際のシステムの低レベル制御に直接作用する確率的ポリシーと(iv)事前知識なしでのスクラッチから数千の試行(v)の列車を,直接,報酬関数(iii)で,直接返送したボールの速度を最大化することを可能にした。さらに,シミュレーションで記録されたボール軌跡をランダム再生し,実際のロボットに動作を適用することにより,訓練中に実際のボールを演ずる実用的なハイブリッドsimと実際の訓練であるHYSRを提案した。本研究は,(a)人間形態ロボットアームを用いた安全クリティカルな動的タスクの失敗安全学習であり,(b)は,制御課題と(c)訓練ロボットが実際のボールなしでテーブルテニスを演ずるにもかかわらず,PAM駆動システムによる精度要求問題を学習する。ビデオとデータセットは,筋TT.塞栓.mlで利用可能である。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
ロボットの運動・制御  ,  人工知能 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る