高速ビデオオブジェクトセグメンテーションのための指向性深層埋込みと外観学習【JST・京大機械翻訳】

Yin Yingjie; Xu De; Wang Xingang; Zhang Lei

プレプリント

J-GLOBAL ID：202202204890588432 整理番号：22P0112449

高速ビデオオブジェクトセグメンテーションのための指向性深層埋込みと外観学習【JST・京大機械翻訳】

Directional Deep Embedding and Appearance Learning for Fast Video Object Segmentation

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2020年02月16日プレプリントサーバーでの情報更新日： 2020年02月16日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

ほとんどの最近の半教師つきビデオオブジェクトセグメンテーション(VOS)法は,最初のフレームの与えられたマスクまたはその後のフレームの予測されたマスクを用いてオンラインの微調整深畳込みニューラルネットワークに頼っている。しかし,オンライン微調整プロセスは,通常時間がかかり,そのような方法の実用化を制限する。高速VOSのためのオンライン微調整プロセスのない,方向性深い埋込みと外観学習(DDEAL)法を提案した。最初に,並列畳み込み演算によって効率的に実装できる大域的方向マッチングモジュールを,内部誘導としてセマンティックピクセルワイズ埋込みを学習するために提案した。第2に,VOSのための球面埋込み空間に関する目標とバックグラウンドを表現するために,効果的方向外観モデルベースの統計を提案した。グローバル方向マッチングモジュールと方向性外見モデル学習モジュールによって,DDEALはラベル付き最初のフレームから静的キューを学習して,オブジェクトセグメンテーションのために次のフレームの手がかりを動的に更新する。この方法は,オンライン微調整を用いずに最先端のVOS性能を示した。特に,それはDAVIS2017データセットで74.8%のJ&F平均スコアと大規模YouTube-VOSデータセットで71.3%の全体的スコアGを達成し,一方,単一NVIDIA TITAN Xp GPUで25fpsの速度を保持した。さらに,著者らのより速いバージョンは,ほんの少しの精度損失で31fpsを実行する。このコードと訓練されたネットワークはhttps://github.com/YingjieYin/Directional Deep Embedding and Appearance Learning for Fast Video Object Segmentationで利用可能である。【JST・京大機械翻訳】

, , , , , , ,
, , , , , , , 【Automatic Indexing@JST】

パターン認識 , 人工知能

, , , , ,

前のページに戻る