文献
J-GLOBAL ID:202202235556519191   整理番号:22A0914205

3D畳込みニューラルネットワークによるビデオ視覚関係検出【JST・京大機械翻訳】

Video Visual Relation Detection via 3D Convolutional Neural Network
著者 (5件):
資料名:
巻: 10  ページ: 23748-23756  発行年: 2022年 
JST資料番号: W2422A  ISSN: 2169-3536  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ビデオ視覚関係検出は,関係三重項<被験者,述語,物体>(例えば,「人-乗り」,「dog-toward-car」など)の形式でオブジェクト間の視覚関係を検出することを狙って,コンピュータビジョンにおける重要で基本的なタスクである。しかし,視覚関係インスタンスに関する既存の研究の大部分は静的画像に集中している。ビデオにおける非静的関係のモデリングは,大規模ビデオデータセットサポートの欠如のため,ほとんど注目を引いている。本研究では,21のオブジェクトクラスと37の述語クラスで高密度の手動動的ラベル付き注釈を持つ1000のビデオからなる動的ビデオ視覚関係検出のためのビデオプリディネート検出と推論(VidPDR)と名付けたビデオデータセットを提案した。さらに,3D畳込みニューラルネットワーク(ST3DCNN)を用いた新しい時空間特徴抽出フレームワークを提案した。公開データセットと著者らのデータセット(VidPDR)に関する適切な実験を行った。結果は,提案手法が最先端のベースラインと比較して大きな改善を有することを示した。Copyright 2022 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る