抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
強化学習法の成功にもかかわらず,広範囲のロボットマニピュレーションタスクに適用した場合,それらのブレークスルーモーメントはまだ有していない。これは,強化学習アルゴリズムが,完全状態入力よりも画像から訓練するときに悪化する,訓練するのが困難で時間がかかるという事実による。人間がマニピュレーションタスクを実行するので,著者らの眼は,操作されるオブジェクトに順次注視して,このプロセスのあらゆるステップを密接に監視する。これを念頭に置いて,著者らは,著者らの注意駆動ロボット操作(ARM)アルゴリズムを提示し,それは,少数の実証のみを与えて,スパース報酬タスクの範囲に適用できる一般的操作アルゴリズムである。ARMは3段階パイプラインへの操作の複雑なタスクを分割する。1)Q-注意エージェントは,RGBとポイントクラウド入力からの関連ピクセル位置,2)Qアテンションエージェントと出力姿勢から作物を受け入れる次の最良姿勢エージェント,および3)目標姿勢と出力結合行動を取る制御エージェントである。現在の学習アルゴリズムはRLBenchタスクの範囲に失敗するが,ARMは成功する。ビデオはhttps://sites.google.com/view/q-attentionで見出された。Copyright 2022 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】