グループベースセグメンテーションのための統一変圧器フレームワーク:共セグメンテーション,共顕著性検出およびビデオ突出オブジェクト検出【JST・京大機械翻訳】

Su Yukun; Deng Jingliang; Sun Ruizhou; Lin Guosheng; Wu Qingyao

プレプリント

J-GLOBAL ID：202202211554585782 整理番号：22P0301358

グループベースセグメンテーションのための統一変圧器フレームワーク:共セグメンテーション,共顕著性検出およびビデオ突出オブジェクト検出【JST・京大機械翻訳】

A Unified Transformer Framework for Group-based Segmentation: Co-Segmentation, Co-Saliency Detection and Video Salient Object Detection

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2022年03月09日プレプリントサーバーでの情報更新日： 2022年03月11日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

人間は,動的世界に住んでいるので,映像のグループまたはビデオのいくつかのフレームからの学習によって,オブジェクトをマイニングする傾向がある。コンピュータビジョン領域において,多くの研究は,共電流オブジェクトを発見するための共セグメンテーション(CoS),共感性検出(CoSD)およびビデオ突出物体検出(VSOD)に焦点を合わせている。しかし,従来手法では,これらの類似タスクに関する異なるネットワークを別々に設計して,それらは互いに応用するのが困難であり,それは深い学習フレームワークの移転可能性の上限を下げる。さらに,それらは画像グループ内の特徴間および特徴間の手がかりを完全に利用できなかった。本論文では,UFO(Co-Objectセグメンテーションのための統一フレームワーク)として,これらの問題に取り組むための統一フレームワークを導入した。具体的には,まず,パッチトークンとして画像特徴を見る変圧器ブロックを導入し,次に自己注意機構を通してそれらの長距離依存性を捉える。これはネットワークが関連オブジェクト間のパッチ構造化類似性を掘削するのに役立つ。さらに,部分活性化を避けるためにネットワークを強化するために自己マスクを生成するMLP学習モジュールを提案した。4つのCoSベンチマーク(PASCAL,iCoseg,インターネットおよびMSRC),3つのCoSDベンチマーク(Cosal2015,CoSOD3k,およびCocA)および4つのVSODベンチマーク(DAVIS16,FBMS,ViSalおよびSegV2)に関する広範な実験は,著者らの方法が,同じネットワークアーキテクチャを用いて,精度および速度の両方において3つの異なるタスクに関して,他の最先端技術より優れていて,それはリアルタイムで140FPSに達することができることを示した。【JST・京大機械翻訳】

, , , , , , , , , , , , ,
, 【Automatic Indexing@JST】

図形・画像処理一般 , パターン認識

, , , ,

前のページに戻る