抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ビデオ検出と人間行動認識は,計算的に高価であり,訓練モデルに長時間を要する。本論文では,ビデオ検出の訓練時間とGPUメモリ利用を低減し,競合検出精度を達成した。2ストリーム,C3D,TSNのような他の研究は,UCF101に関して優れた性能を示した。ここでは,ビデオ検出のためにLSTM構造を使用した。著者らは,UCF101の全検証データセット上で競合トップ1精度を実行するために簡単な構造を使用した。LSTM構造は,深い時間的特徴を処理するので,Contex-LSTMと名付けられた。文脈-LSTMは,人間認識システムをシミュレーションする可能性がある。PyTトーチのLSTMブロックをカスケードし,セル状態フローと隠れ出力フローを接続した。ブロックの接続において,ReLU,バッチ正規化およびMaxPooling関数を用いた。文脈-LSTMは,訓練時間とGPUメモリ利用を低減でき,一方,UCF101全検証データセットに関する最先端のトップ1精度を維持しながら,ビデオ動作検出に関するロバスト性能を示した。【JST・京大機械翻訳】