文献
J-GLOBAL ID:202002278209828748   整理番号:20A2262968

ゼロショットイベント検出とイベントキャプションのための視覚的概念の接地【JST・京大機械翻訳】

Grounding Visual Concepts for Zero-Shot Event Detection and Event Captioning
著者 (6件):
資料名:
号: KDD ’20  ページ: 297-305  発行年: 2020年 
JST資料番号: D0698C  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ソーシャルメディアプラットフォームの仕上げは,大規模のメディアの内容を理解するための技術を必要とする。しかしながら,最先端のビデオイベント理解手法は,データスパース性,意味的非表現事象名,および視覚とテキスト概念間のコヒーレンスの欠如を扱う能力に関して非常に限られている。したがって,本論文では,ゼロショット設定における大規模マルチメディアイベント検出(MED)とマルチメディアイベント捕捉(MEC)のための視覚概念を接地する方法を提案した。より具体的には,著者らのフレームワークは次のように構成する。1)イベント名よりも,テキスト記述からイベントの新しい意味表現を導く;(2)MEDタスクのための接地概念のランクを集約する。統計的平均シフト異常値排除モデルを提案して,不正確に接地される外れた概念を除去した。(3)MECタスクを定義し,ゼロショット設定でMEDで検出されたビデオによりMEC訓練セットを補強する。著者らの知る限り,本研究は,ビデオイベントの理解に向けた更なるステップであるMECタスクを定義し,解決する初めてである。広範な実験を行い,TRECVID MEDTestデータセットおよび新しく提案したTRECVID-MECデータセットに関する最先端の性能を達成した。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  図形・画像処理一般 

前のページに戻る