変圧器がロボット把持に出会うとき:効率的な把握検出のコンテキスト【JST・京大機械翻訳】

Wang Shaochen; Zhou Zhangli; Kan Zhen

プレプリント

J-GLOBAL ID：202202213184081294 整理番号：22P0294523

変圧器がロボット把持に出会うとき:効率的な把握検出のコンテキスト【JST・京大機械翻訳】

When Transformer Meets Robotic Grasping: Exploits Context for Efficient Grasp Detection

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (3件)： , ,
資料名：
発行年： 2022年02月24日プレプリントサーバーでの情報更新日： 2022年09月13日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

本論文では,ロボット把持検出のための変圧器ベースアーキテクチャ,すなわちTF-Graspを提案した。開発したTF-Graspフレームワークは,視覚把持タスクによく適した2つの精巧な設計を有する。最初の鍵設計は,局所文脈情報と把持可能オブジェクトの詳細な特徴を把握するための局所ウィンドウ注意を採用したことである。次に,著者らは交差ウィンドウ注意を適用して,遠隔画素間の長期依存性をモデル化した。オブジェクト知識,環境構成,および異なる視覚エンティティ間の関係を,その後の把持検出のために集約した。第2の鍵設計は,スキップ接続による階層的符号器デコーダアーキテクチャを構築し,符号器から復号器に浅い特徴を与え,マルチスケール特徴融合を可能にすることである。強力な注意機構により,TF-Graspは,同時に局所情報(即ち,物体の輪郭)を得ることができ,クラッタにおける明確な視覚概念間の関係のような長期接続をモデル化する。広範な計算実験は,TF-Graspが,最先端の把持畳込みモデルに対して,優れた結果を達成し,CornellとJacquard把持データセットで,それぞれ,97.99%と94.6%の高い精度を達成することを示した。7DoF Franka Emka Pandaロボットを用いた実世界実験により,様々なシナリオにおいて,非意味オブジェクトの把持能力も実証した。コードと事前訓練モデルは,https://github.com/WangShaoSUN/grasp transformerで利用可能である。【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

ロボットの運動・制御 , ロボットの設計・製造・構造要素

, , , ,

前のページに戻る