STEm-Seg:ビデオにおけるインスタンスセグメンテーションのための時空間埋込み【JST・京大機械翻訳】

Athar Ali; Mahadevan Sabarinath; Osep Aljosa; Leal-Taixe Laura; Leibe Bastian

プレプリント

J-GLOBAL ID：202202202576540279 整理番号：22P0124461

STEm-Seg:ビデオにおけるインスタンスセグメンテーションのための時空間埋込み【JST・京大機械翻訳】

STEm-Seg: Spatio-temporal Embeddings for Instance Segmentation in Videos

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2020年03月18日プレプリントサーバーでの情報更新日： 2023年09月01日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。

ビデオにおけるインスタンスセグメンテーションのための既存の方法は,通常,トラッキングバイ検出パラダイムに従う多段パイプラインを含み,画像列としてビデオクリップをモデル化する。多重ネットワークを用いて,個々のフレームにおけるオブジェクトを検出し,次にこれらの検出を時間にわたって関連させた。したがって,これらの方法は,しばしば非エンドツーエンド訓練可能で,特定のタスクに高度に調整される。本論文では,ビデオにおけるインスタンスセグメンテーションを含むさまざまなタスクにうまく適合した異なるアプローチを提案した。特に,単一3D空間時間体積としてビデオクリップをモデル化し,単一段階で空間と時間にわたってインスタンスを分割し,追跡する新しい方法を提案した。この問題定式化は,全ビデオクリップ上の特定のオブジェクトインスタンスに属する画素をクラスタ化するために訓練された時空間埋込みのアイデアの周りに中心を置く。この目的のために,(i)時空間埋込みの特徴表現を強化する新しい混合関数,および(ii)時間コンテキストを理由とする単一段階,提案フリーネットワーク,を導入した。このネットワークを,これらの埋込みをクラスタ化するのに必要なパラメータだけでなく,空間-時間埋込みを学習するためにエンドツーエンドに訓練し,推論を単純化する。提案手法は,複数のデータセットとタスクを横断して最先端の結果を達成する。コードとモデルはhttps://github.com/sabarim/STEm Segで利用可能である。【JST・京大機械翻訳】

, , , , , , , , , , ,
, , , , 【Automatic Indexing@JST】

パターン認識 , 図形・画像処理一般

, , , , ,

前のページに戻る