抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
時間モデリングはビデオにおける行動認識の鍵である。通常,短距離運動と長距離凝集の両方を考慮する。本論文では,運動励起(ME)モジュールと多重時間凝集(MTA)モジュールを含む時間励起と凝集(TEA)ブロックを提案し,特に短範囲と長範囲の時間的発展の両方を捕捉するように設計した。特に,短範囲運動モデリングのために,MEモジュールは時空間特徴から特徴レベル時間差を計算する。次に,特徴の運動感受性チャネルを励起する差異を利用した。以前の研究での長距離時間的凝集は,多数の局所時間畳込みを積み重ねることによって典型的に達成される。各畳み込みは,時間内に局所時間窓を課す。対照的に,MTAモジュールは局所畳込みをサブ畳込みのグループに変形させ,階層的残差アーキテクチャを形成する。付加的パラメータを導入することなく,この特徴を一連のサブ畳込みで処理して,各フレームは近隣で複数の時間的集約を完了することができた。時間次元の最終等価受容場は,それに応じて拡大され,それは,遠距離フレーム上の長距離時間的関係をモデル化することができる。TEAブロックの2つの成分は,一時的モデリングにおいて相補的であった。最後に,本手法は,いくつかの行動認識ベンチマーク(例えば,速度,いくつかのSomething,HMDB51,およびUCF101)で,低いFLOPで印象的な結果を達成し,その有効性と効率を確認した。【JST・京大機械翻訳】