ビデオ人物再同定のためのマルチスケール時間キュー学習【JST・京大機械翻訳】

Li Jianing; Zhang Shiliang; Huang Tiejun

文献

J-GLOBAL ID：202002240257879311 整理番号：20A0827428

ビデオ人物再同定のためのマルチスケール時間キュー学習【JST・京大機械翻訳】

Multi-Scale Temporal Cues Learning for Video Person Re-Identification

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=20A0827428&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=20A0827428&from=J-GLOBAL&jstjournalNo=W0364A") }}

著者 (3件)： , ,
資料名：
巻： 29 ページ： 4461-4473 発行年： 2020年
JST資料番号： W0364A ISSN： 1057-7149 CODEN： IIPRE4 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

ビデオに埋め込まれた時間キューは,人物再同定(Reid)のための重要な手掛かりを提供する。コンパクトなニューラルネットワークによる時間キューを効率的に利用するために,本研究では,マルチスケール3D(M3D)コンボリューション層と呼ばれる新しい3Dコンボリューション層を提案した。M3D層は実装が容易で,エンドツーエンド訓練により多重スケール時間キューを学習するために,従来の2Dコンボリューションネットワークに挿入できる。挿入位置によると,M3D層は,それぞれ,局所M3D層とグローバルM3D層の2つのバリアントを持っている。隣接する2D特徴マップ間の空間時間キューを学習するために,2D畳込み層間に局所M3D層を挿入した。グローバルなM3D層を,それらのグローバルな時間的関係を学習するために,隣接フレーム特徴ベクトル上で計算した。したがって,局所的およびグローバルなM3D層は相補的な時間キューを学習する。それらの組合せは,従来の2D CNNに対するパラメータの一部を導入するが,強いマルチスケール時間特徴学習能力をもたらす。学習された時間的特徴を空間的特徴と融合し,ビデオ人Reidに対する最終的な空間時間表現を構成した。4つの広く使われているビデオ人Reidデータセット,すなわち,MARS,DukeMTMC-VideoReID,PRIID2011,およびiLIDS-VIDに関する評価は,最新技術に対する著者らの方法の実質的利点を実証した。例えば,それは再ランキングなしでMARSに関して88.63%のランク精度を達成した。この方法はまた,Reid精度とモデルサイズの間の合理的なトレードオフを達成し,例えば,それはI3D CNNの約40%のパラメータを節約する。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , , ,
, , , , 【Automatic Indexing@JST】

図形・画像処理一般

, , , , ,

前のページに戻る