文献
J-GLOBAL ID:202202247939452168   整理番号:22A1105375

ゼロショット動作認識のための注意ベースビデオディスエンタングとマッチングネットワーク【JST・京大機械翻訳】

Attention-Based Video Disentangling and Matching Network for Zero-Shot Action Recognition
著者 (5件):
資料名:
巻: 878  ページ: 368-375  発行年: 2022年 
JST資料番号: W5070A  ISSN: 1876-1100  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
視覚空間と意味空間のマッピング関係を学習することによって,ゼロショット行動認識(ZSAR)を達成した。既存の方法は,通常,視覚空間を構築するためにSOTAバックボーンネットワークを利用する。これらの方法は2つの主要な制限がある。第1に,行動認識に重要な人間運動情報は,背景で混乱するのが容易である。第2に,行動間の相関を反映する重要な情報は,ビデオシーケンスの冗長性のため,違反に陥る可能性がある。本論文では,上記の問題を解決するために,注意ベースビデオ分散マッチングネットワーク(AVDMN)を提案した。具体的には,ビデオ分散機構を提案することにより,セグメント毎のビデオを背景ストリームと人間の動きストリームに分解する。さらに,行動間の相関をさらに強調するために,上記の情報のキーコンポーネントを抽出するための注意モジュールを設計した。最後に,相関学習モジュールを導入して,ビデオ表現と行動ラベルの間の距離または類似性を学習して,測定した。3つの現実的行動ベンチマークオリンピックスポーツ,HMDB51,およびUCF101に関する実験は,提案アーキテクチャがZSAR方式の間で好ましい性能を達成することを示した。Copyright The Author(s), under exclusive license to Springer Nature Singapore Pte Ltd. 2022 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  図形・画像処理一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る