プレプリント
J-GLOBAL ID:202202215346090899   整理番号:22P0275464

効率的なビデオ認識のためのアクションキーポイントネットワーク【JST・京大機械翻訳】

Action Keypoint Network for Efficient Video Recognition
著者 (5件):
資料名:
発行年: 2022年01月17日  プレプリントサーバーでの情報更新日: 2022年01月17日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
冗長性の減少は,ビデオ認識モデルの効率を改善するために重要である。効果的なアプローチは,全体的ビデオから有益なコンテンツを選択することであり,動的ビデオ認識法の一般的なファミリーを生成する。しかし,既存の動的方法は,冗長性が通常空間的および時間的である現実を無視しながら,時間的または空間的選択のいずれかに焦点を合わせた。さらに,それらの選択された含有量は,通常,固定形状で作付され,一方,有益なコンテンツの現実的分布は,はるかに多様である。これら2つの洞察により,本論文は,Action Keypoint Network(AK-Net)に時間的および空間的選択を統合することを提案する。異なるフレームと位置から,AK-Netは,行動キーポイントの集合として任意形状領域で散乱したいくつかの有益なポイントを選択し,次にビデオ認識をポイントクラウド分類に変換する。AK-Netは,2つのステップ,すなわちキーポイント選択とポイントクラウド分類を持った。最初に,ビデオをベースラインネットワークに入力し,中間層から特徴マップを出力する。空間-時間点としてこの特徴マップ上の各画素を見て,自己注意を用いていくつかの有益なキーポイントを選択した。第2に,AK-Netは,順序1Dシーケンスにキーポイントを配置するためのランキング基準を考案する。同時に,AK-Netは効率に対して2倍の利点をもたらす:キーポイント選択ステップは任意の形状内の情報量を収集し,空間-時間依存性をモデル化するための効率を増加させ,一方,ポイントクラウド分類ステップは畳み込みカーネルを圧縮することにより計算コストをさらに削減する。実験結果は,AK-Netが,いくつかのビデオ認識ベンチマークに関して,ベースライン方法の効率性と性能を一貫して改良することができることを示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  図形・画像処理一般 
タイトルに関連する用語 (1件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る