文献
J-GLOBAL ID:202002240257879311   整理番号:20A0827428

ビデオ人物再同定のためのマルチスケール時間キュー学習【JST・京大機械翻訳】

Multi-Scale Temporal Cues Learning for Video Person Re-Identification
著者 (3件):
資料名:
巻: 29  ページ: 4461-4473  発行年: 2020年 
JST資料番号: W0364A  ISSN: 1057-7149  CODEN: IIPRE4  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ビデオに埋め込まれた時間キューは,人物再同定(Reid)のための重要な手掛かりを提供する。コンパクトなニューラルネットワークによる時間キューを効率的に利用するために,本研究では,マルチスケール3D(M3D)コンボリューション層と呼ばれる新しい3Dコンボリューション層を提案した。M3D層は実装が容易で,エンドツーエンド訓練により多重スケール時間キューを学習するために,従来の2Dコンボリューションネットワークに挿入できる。挿入位置によると,M3D層は,それぞれ,局所M3D層とグローバルM3D層の2つのバリアントを持っている。隣接する2D特徴マップ間の空間時間キューを学習するために,2D畳込み層間に局所M3D層を挿入した。グローバルなM3D層を,それらのグローバルな時間的関係を学習するために,隣接フレーム特徴ベクトル上で計算した。したがって,局所的およびグローバルなM3D層は相補的な時間キューを学習する。それらの組合せは,従来の2D CNNに対するパラメータの一部を導入するが,強いマルチスケール時間特徴学習能力をもたらす。学習された時間的特徴を空間的特徴と融合し,ビデオ人Reidに対する最終的な空間時間表現を構成した。4つの広く使われているビデオ人Reidデータセット,すなわち,MARS,DukeMTMC-VideoReID,PRIID2011,およびiLIDS-VIDに関する評価は,最新技術に対する著者らの方法の実質的利点を実証した。例えば,それは再ランキングなしでMARSに関して88.63%のランク精度を達成した。この方法はまた,Reid精度とモデルサイズの間の合理的なトレードオフを達成し,例えば,それはI3D CNNの約40%のパラメータを節約する。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 

前のページに戻る