行動認識のためのカスケードマルチヘッド注意ネットワーク【JST・京大機械翻訳】

Wang Jiaze; Wang Jiaze; Peng Xiaojiang; Peng Xiaojiang; Qiao Yu; Qiao Yu

文献

J-GLOBAL ID：202002270901633681 整理番号：20A0454939

行動認識のためのカスケードマルチヘッド注意ネットワーク【JST・京大機械翻訳】

Cascade multi-head attention networks for action recognition

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=20A0454939&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=20A0454939&from=J-GLOBAL&jstjournalNo=W0185A") }}

著者 (6件)： , , , , ,
資料名：
巻： 192 ページ： Null 発行年： 2020年
JST資料番号： W0185A ISSN： 1077-3142 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：オランダ (NLD) 言語：英語 (EN)

長期的な時間的情報はビデオ行動理解のための重要な手がかりを与える。これまでの研究は,長期的な時間的モデリングのための局所的な時間的特徴を統合するために,再帰ネットワーク,メモリユニット,セグメントモデル,自己注意メカニズムなどの逐次モデルに常に依存している。メモリユニットによる時間的パターン(または関係)を記録する再帰またはメモリネットワークは,機械翻訳における長期情報を捉えることが困難であることが証明されている。自己注意機構は,前者より直接的で効率的な注意重みを持つすべての局所情報を直接集約する。しかしながら,自己注意からの注意重みは,信頼できない注意をもたらす可能性がある局所情報とグローバル情報の間の関係を無視する。この目的のために,著者らは新しい注意ネットワークアーキテクチャを提案する。それは,2レベルの注意,すなわちマルチヘッド局所自己注意と関係ベースのグローバルな注意によってビデオ表現を構築するカスケードマルチヘッド注意ネットワーク(CATNet)と呼ばれる。バックボーンネットワークにより生成されるセグメント特徴から出発して,CATNetは,最初に各セグメントに対する複数の注意重みを学習し,自己注意様式における局所特徴の重要性を捉える。局所的注意重みによって,CATNETは,局所的特徴をいくつかのグローバル表現に統合して,次に,関連方法によってグローバル情報のために第2のレベル注意を学んだ。Kineics,HMDB51,およびUCF101に関する広範な実験は,著者らのCATNetが大きなマージンを有するベースラインネットワークをブーストすることを示した。RGB情報のみで,これらの3つのデータセット上でそれぞれ75.8%,75.2%,および96.0%を達成し,それらは芸術の状態に匹敵するか,または優れている。Copyright 2020 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】

, , , , , ,
, , , 【Automatic Indexing@JST】

著者キーワード (4件)： , , ,

パターン認識 , 図形・画像処理一般

, , ,

前のページに戻る