TEA:行動認識のための時間的励起と集約【JST・京大機械翻訳】

Li Yan; Ji Bin; Shi Xintian; Zhang Jianguo; Kang Bin; Wang Limin

プレプリント

J-GLOBAL ID：202202210392125875 整理番号：22P0130522

TEA:行動認識のための時間的励起と集約【JST・京大機械翻訳】

TEA: Temporal Excitation and Aggregation for Action Recognition

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (6件)： , , , , ,
資料名：
発行年： 2020年04月03日プレプリントサーバーでの情報更新日： 2020年04月03日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

時間モデリングはビデオにおける行動認識の鍵である。通常,短距離運動と長距離凝集の両方を考慮する。本論文では,運動励起(ME)モジュールと多重時間凝集(MTA)モジュールを含む時間励起と凝集(TEA)ブロックを提案し,特に短範囲と長範囲の時間的発展の両方を捕捉するように設計した。特に,短範囲運動モデリングのために,MEモジュールは時空間特徴から特徴レベル時間差を計算する。次に,特徴の運動感受性チャネルを励起する差異を利用した。以前の研究での長距離時間的凝集は,多数の局所時間畳込みを積み重ねることによって典型的に達成される。各畳み込みは,時間内に局所時間窓を課す。対照的に,MTAモジュールは局所畳込みをサブ畳込みのグループに変形させ,階層的残差アーキテクチャを形成する。付加的パラメータを導入することなく,この特徴を一連のサブ畳込みで処理して,各フレームは近隣で複数の時間的集約を完了することができた。時間次元の最終等価受容場は,それに応じて拡大され,それは,遠距離フレーム上の長距離時間的関係をモデル化することができる。TEAブロックの2つの成分は,一時的モデリングにおいて相補的であった。最後に,本手法は,いくつかの行動認識ベンチマーク(例えば,速度,いくつかのSomething,HMDB51,およびUCF101)で,低いFLOPで印象的な結果を達成し,その有効性と効率を確認した。【JST・京大機械翻訳】

, , , , , , , , , , , ,
, , , 【Automatic Indexing@JST】

パターン認識

, , ,

前のページに戻る