抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
長い非トリミングビデオにおける時間的位置決めと分類作用セグメントは,監視とロボットのような多くの応用に特に興味がある。従来のアプローチは二段階パイプラインに従うが,フレームごとの確率を生成し,次に高レベルの時間モデルにそれらを供給することにより,最近のアプローチはビデオフレームを直接分類するために時間的畳込みを使用する。本論文では,時間的行動セグメンテーションタスクのための多段アーキテクチャを導入した。各段階は,次のものによって精密化される初期予測を生成するために,拡張された時間的畳込みの集合を特徴とする。このアーキテクチャは,分類損失と提案した平滑化損失の組合せを用いて訓練され,過剰セグメンテーション誤差をペナルティ化する。広範な評価により,長距離依存性の獲得と行動セグメントの認識における提案モデルの有効性を示した。著者らのモデルは,3つの挑戦的データセットに関する最先端の結果を達成した。すなわち,50Salads,Georgia Tech egogentric Activities(GTEA),およびBreakfastデータセットである。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】