単一ショットビデオオブジェクト検出器【JST・京大機械翻訳】

Deng Jiajun; Pan Yingwei; Yao Ting; Zhou Wengang; Li Houqiang; Mei Tao

プレプリント

J-GLOBAL ID：202202206024013890 整理番号：22P0168302

単一ショットビデオオブジェクト検出器【JST・京大機械翻訳】

Single Shot Video Object Detector

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (6件)： , , , , ,
資料名：
発行年： 2020年07月07日プレプリントサーバーでの情報更新日： 2020年07月07日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

2段検出器よりも潜在的に速く,より単純な単一ショット検出器は,ビデオにおける物体検出により適用可能である傾向がある。それにもかかわらず,画像からビデオへのそのようなオブジェクト検出器の拡張は,外観劣化がビデオ,例えばモーションブラーまたはオクルージョンに存在するとき,特に自明でない。有効な問題は,ブースティング検出に対するフレーム間の時間的コヒーレンスを探索する方法である。本論文では,隣接フレームの集合を通して,フレームごとの特徴を強化することにより,この問題に対処することを提案する。特に,ビデオにおける物体検出のための1段検出器に特徴集約を新規に統合する新しいアーキテクチャである単一ショットビデオオブジェクト検出器(SSVD)を提案した。技術的に,SSVDはバックボーンネットワークとして特徴ピラミッドネットワーク(FPN)をとり,マルチスケール特徴を生成する。既存の特徴集約法とは異なり,SSVDは,一方では,動き経路に沿った近くの特徴を推定し,そして,他方では,2ストリーム構造における隣接フレームから特徴を直接サンプリングすることによって,幻覚物の特徴が特徴付けられる。広範囲の実験をImageNet VIDデータセット上で行い,最新の手法と比較して競合結果を報告した。より注目すべきことに,448×448入力に対して,SSVDは,Nvidia Titan X Pascal GPU上で85msの1フレームを処理することにより,ImageNet VID上で79.2%mAPを達成した。このコードは,ウルル{https://github.com/ddjiajun/SSVD}で利用可能である。【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , 【Automatic Indexing@JST】

図形・画像処理一般 , パターン認識

前のページに戻る