抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,ロボット把持検出のための変圧器ベースアーキテクチャ,すなわちTF-Graspを提案した。開発したTF-Graspフレームワークは,視覚把持タスクによく適した2つの精巧な設計を有する。最初の鍵設計は,局所文脈情報と把持可能オブジェクトの詳細な特徴を把握するための局所ウィンドウ注意を採用したことである。次に,著者らは交差ウィンドウ注意を適用して,遠隔画素間の長期依存性をモデル化した。オブジェクト知識,環境構成,および異なる視覚エンティティ間の関係を,その後の把持検出のために集約した。第2の鍵設計は,スキップ接続による階層的符号器デコーダアーキテクチャを構築し,符号器から復号器に浅い特徴を与え,マルチスケール特徴融合を可能にすることである。強力な注意機構により,TF-Graspは,同時に局所情報(即ち,物体の輪郭)を得ることができ,クラッタにおける明確な視覚概念間の関係のような長期接続をモデル化する。広範な計算実験は,TF-Graspが,最先端の把持畳込みモデルに対して,優れた結果を達成し,CornellとJacquard把持データセットで,それぞれ,97.99%と94.6%の高い精度を達成することを示した。7DoF Franka Emka Pandaロボットを用いた実世界実験により,様々なシナリオにおいて,非意味オブジェクトの把持能力も実証した。コードと事前訓練モデルは,https://github.com/WangShaoSUN/grasp transformerで利用可能である。【JST・京大機械翻訳】