カスケードポジティブ検索による自己管理ビデオ表現学習【JST・京大機械翻訳】

Wu Cheng-En; Lai Farley; Hu Yu Hen; Kadav Asim

プレプリント

J-GLOBAL ID：202202216669642005 整理番号：22P0277149

カスケードポジティブ検索による自己管理ビデオ表現学習【JST・京大機械翻訳】

Self-supervised Video Representation Learning with Cascade Positive Retrieval

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2022年01月19日プレプリントサーバーでの情報更新日： 2022年04月20日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

自己監督ビデオ表現学習は,ビデオ検索や行動認識のような下流タスクを効果的に改善することが示されている。本論文では,ステージのカスケードにおけるコントラスト学習のためのクエリーを逐次マイニングするCascadeポジティブ検索(CPR)を提示した。特に,CPRは,異なるモダリティにおけるクエリ事例の多重ビューを利用し,そこでは,代替ビューは,クエリビューにおいて別の肯定的な例を見つけるのを助けるかもしれない。著者らは,採掘段階の数,各段階におけるトップ類似例選択比,および最終Top-k選択の増分数による進行性訓練を含むアブレーションにおける可能なCPR構成の影響を調べた。全体のマイニング品質は,訓練セットクラスを通して思い出しを反映するために測定した。CPRは83.3%の中央値クラスマイニングリコールに達し,5.5%の以前の研究を凌駕する。実装ワイズでは,CPRはプレテキストタスクに相補的であり,以前の研究に容易に適用できる。UCF101に関する予訓練の評価において,CPRは既存の仕事を一貫して改善し,ビデオ検索において56.7%および24.4%の最先端のR@1を達成し,UCF101およびHMDB51に関する行動認識において83.8%および54.8%を達成した。コードはhttps://github.com/necla ml/CPRで利用可能である。【JST・京大機械翻訳】

, , , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

図形・画像処理一般

, , ,

前のページに戻る