プレプリント
J-GLOBAL ID:202202204794038057   整理番号:22P0148436

キャラクターマター:文字認識関係によるビデオ物語理解【JST・京大機械翻訳】

Character Matters: Video Story Understanding with Character-Aware Relations
著者 (6件):
資料名:
発行年: 2020年05月09日  プレプリントサーバーでの情報更新日: 2020年05月09日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
短いビデオとGIFと異なり,ビデオ階は,明確なプロットと主要な特徴のリストを含む。出現している人々と文字名の間の接続を同定することなく,モデルはプロットの真の理解を得ることができない。ビデオ層質問応答(VSQA)は,モデルのより高いレベル理解能力をベンチマークするための効果的な方法を提供する。しかし,現在のVSQA法は,単にシーンから一般的な視覚特徴を抽出する。このようなアプローチにより,それらは表面相関を学習する傾向がある。何が何処かの真の理解を達成するために,著者らは,特性意識関係を連続的に洗練する新しいモデルを提案した。このモデルは,異なる特性とオブジェクトを接続する関係と同様に,ビデオ階における特性を特異的に考慮している。これらの信号に基づいて,このフレームワークは,マルチインスタンス共起マッチングを通して弱く監督された顔命名を可能にし,変換器構造を利用する高レベル推論をサポートする。TVQAデータセットにおいて,6つの多様なTV上でこのモデルを訓練し,テストし,VSQAに対して最大で公開利用可能なデータセットのみである。拡張アブレーション研究を通してTVQAデータセット上で提案した方法を検証した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  パターン認識 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る