文献
J-GLOBAL ID:202102267414010742   整理番号:21A3307541

3次元セマンティック外観アラインメントとクロスモーダル対話型学習を用いた画像対ビデオ人物再同定【JST・京大機械翻訳】

Image-to-video person re-identification using three-dimensional semantic appearance alignment and cross-modal interactive learning
著者 (3件):
資料名:
巻: 122  ページ: Null  発行年: 2022年 
JST資料番号: D0611A  ISSN: 0031-3203  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
画像ベースクエリとビデオベースギャラリー間の人間ターゲット検索を目的とする画像対ビデオ人再識別(I2V ReID)は,最近,新しい研究焦点になった。しかし,姿勢変動,カメラビュー,誤検出,および異なるデータタイプによって引き起こされた画像とビデオの両方における外観不整合とモダリティミスアラインメントは,I2V ReIDをまだ困難にする。この目的のために,前述の2つの課題に取り組むために,三次元セマンティック外見アラインメント(3D-SAA)と交差モード対話型学習(CMIL)に基づく深いI2V ReIDパイプラインを提案する。特に,3D-SAAモジュールにおいて,高密度3D人間外観推定によって抽出された整列局所外観画像は,より細かい粒子同一性特徴を学ぶために,グローバル画像およびビデオ埋込みストリームと連結している。整列局所外見画像は,無視できる身体部分を弱めるために,提案した多分岐集合ネットワークによってさらに意味的に集約される。さらに,モダリティミスアラインメントの影響を克服するために,CMILモジュールは,画像特徴マップのチャネルにビデオ中の時間情報を対話的に伝搬することにより,大域的画像とビデオストリーム間の通信を可能にする。挑戦的なMARS,DukeMTMC-VideoReIDおよびiLIDS-VIDデータセットに関する広範な実験は,著者らのアプローチの優位性を示した。Copyright 2021 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
著者キーワード (3件):
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識 

前のページに戻る