抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
2段検出器よりも潜在的に速く,より単純な単一ショット検出器は,ビデオにおける物体検出により適用可能である傾向がある。それにもかかわらず,画像からビデオへのそのようなオブジェクト検出器の拡張は,外観劣化がビデオ,例えばモーションブラーまたはオクルージョンに存在するとき,特に自明でない。有効な問題は,ブースティング検出に対するフレーム間の時間的コヒーレンスを探索する方法である。本論文では,隣接フレームの集合を通して,フレームごとの特徴を強化することにより,この問題に対処することを提案する。特に,ビデオにおける物体検出のための1段検出器に特徴集約を新規に統合する新しいアーキテクチャである単一ショットビデオオブジェクト検出器(SSVD)を提案した。技術的に,SSVDはバックボーンネットワークとして特徴ピラミッドネットワーク(FPN)をとり,マルチスケール特徴を生成する。既存の特徴集約法とは異なり,SSVDは,一方では,動き経路に沿った近くの特徴を推定し,そして,他方では,2ストリーム構造における隣接フレームから特徴を直接サンプリングすることによって,幻覚物の特徴が特徴付けられる。広範囲の実験をImageNet VIDデータセット上で行い,最新の手法と比較して競合結果を報告した。より注目すべきことに,448×448入力に対して,SSVDは,Nvidia Titan X Pascal GPU上で85msの1フレームを処理することにより,ImageNet VID上で79.2%mAPを達成した。このコードは,ウルル{https://github.com/ddjiajun/SSVD}で利用可能である。【JST・京大機械翻訳】