文献
J-GLOBAL ID:202202276385406084   整理番号:22A0772396

自己教師つきビデオ表現学習のための動的ブースティング注意【JST・京大機械翻訳】

Dynamic-boosting attention for self-supervised video representation learning
著者 (4件):
資料名:
巻: 52  号:ページ: 3143-3155  発行年: 2022年 
JST資料番号: W0297A  ISSN: 0924-669X  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
自己監督ビデオ表現学習は,下流タスク,すなわち行動認識のためのスケーラブルなビデオ表現を得るために,データ自体の監視信号を利用する。これまでの方法は,ビデオフレーム間の時間的関係を学習するために,主に時間信号を利用する。しかし,これらの方法はセマンティックラベルの欠如によりビデオの弱い意味情報を学習する。さらに,それらは意味のないフレームの干渉のために十分にモデルを訓練できない。これらの問題に取り組むために,本論文は,新しい自己監督されたビデオ表現学習法を提案して,それはネットワークをコンパクトで有効な意味情報とビデオの一時的関係の学習に誘導する。具体的には,ビデオフレームの時間関係を学習するためにビデオクリップ次数予測(VCOP)プリテキストタスクを導入した。VCOPに基づいて,著者らはさらにビデオ意味情報をマイニングして,キーフレームをソフトに選択するために,動的ブースティング注意(DBA)モジュールを提案した。DBAは動的ブースティング方式を実行し,高レベルビデオ特徴から意味情報を抽出し,低レベル鍵フレーム特徴を柔軟に選択するために意味情報を使用する。提案手法で3D CNNを訓練し,2つの下流タスクの事前訓練モデルとして学習モデルを適用した。実験結果は,著者らのDBA方式が自己監督学習の訓練効率を増加させることができることを示した。注目すべきことに,著者らの3D CNNモデルは,大きな意味知識を学習して,下流タスクに関して明白な改良を達成した。Copyright The Author(s), under exclusive licence to Springer Science+Business Media, LLC, part of Springer Nature 2021 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
著者キーワード (3件):
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  人工知能 

前のページに戻る