文脈-LSTM:UCF101上のビデオ検出のためのロバストな分類器【JST・京大機械翻訳】

Li Dengshan; Wang Rujing

プレプリント

J-GLOBAL ID：202202208246315544 整理番号：22P0303260

文脈-LSTM:UCF101上のビデオ検出のためのロバストな分類器【JST・京大機械翻訳】

Context-LSTM: a robust classifier for video detection on UCF101

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (2件)： ,
資料名：
発行年： 2022年03月13日プレプリントサーバーでの情報更新日： 2022年03月13日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

ビデオ検出と人間行動認識は,計算的に高価であり,訓練モデルに長時間を要する。本論文では,ビデオ検出の訓練時間とGPUメモリ利用を低減し,競合検出精度を達成した。2ストリーム,C3D,TSNのような他の研究は,UCF101に関して優れた性能を示した。ここでは,ビデオ検出のためにLSTM構造を使用した。著者らは,UCF101の全検証データセット上で競合トップ1精度を実行するために簡単な構造を使用した。LSTM構造は,深い時間的特徴を処理するので,Contex-LSTMと名付けられた。文脈-LSTMは,人間認識システムをシミュレーションする可能性がある。PyTトーチのLSTMブロックをカスケードし,セル状態フローと隠れ出力フローを接続した。ブロックの接続において,ReLU,バッチ正規化およびMaxPooling関数を用いた。文脈-LSTMは,訓練時間とGPUメモリ利用を低減でき,一方,UCF101全検証データセットに関する最先端のトップ1精度を維持しながら,ビデオ動作検出に関するロバスト性能を示した。【JST・京大機械翻訳】

, , , , , , , , ,
, , , , 【Automatic Indexing@JST】

パターン認識

, , , ,

前のページに戻る