抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自己監督ビデオ表現学習は,ビデオ検索や行動認識のような下流タスクを効果的に改善することが示されている。本論文では,ステージのカスケードにおけるコントラスト学習のためのクエリーを逐次マイニングするCascadeポジティブ検索(CPR)を提示した。特に,CPRは,異なるモダリティにおけるクエリ事例の多重ビューを利用し,そこでは,代替ビューは,クエリビューにおいて別の肯定的な例を見つけるのを助けるかもしれない。著者らは,採掘段階の数,各段階におけるトップ類似例選択比,および最終Top-k選択の増分数による進行性訓練を含むアブレーションにおける可能なCPR構成の影響を調べた。全体のマイニング品質は,訓練セットクラスを通して思い出しを反映するために測定した。CPRは83.3%の中央値クラスマイニングリコールに達し,5.5%の以前の研究を凌駕する。実装ワイズでは,CPRはプレテキストタスクに相補的であり,以前の研究に容易に適用できる。UCF101に関する予訓練の評価において,CPRは既存の仕事を一貫して改善し,ビデオ検索において56.7%および24.4%の最先端のR@1を達成し,UCF101およびHMDB51に関する行動認識において83.8%および54.8%を達成した。コードはhttps://github.com/necla ml/CPRで利用可能である。【JST・京大機械翻訳】