プレプリント
J-GLOBAL ID:202202211987599877   整理番号:21P0029384

問合せ文からのビデオ検索のための多重視覚-意味論的埋込み【JST・京大機械翻訳】

Multiple Visual-Semantic Embedding for Video Retrieval from Query Sentence
著者 (4件):
資料名:
発行年: 2020年04月16日  プレプリントサーバーでの情報更新日: 2020年04月16日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
視覚-意味埋込みは,関連するビデオと文章インスタンスが互いに近接する関節埋込み空間を学習することを目的とする。ほとんどの既存の方法は,単一埋込み空間にインスタンスを入れた。しかしながら,それらは,文章におけるテキスト特徴に対するビデオにおける視覚動力学のマッチングの困難さのために,インスタンスを埋め込むことに苦しんでいる。単一空間は,様々なビデオと文章を収容するのに十分でない。本論文では,インスタンス間の複数の関係を捕捉することができるように,複数の個々の埋込み空間にインスタンスを写像する新しいフレームワークを提案し,その結果,強力なビデオ検索を導いた。加重和戦略を用いて各埋込み空間で測定した類似性を融合することにより,インスタンス間の最終類似性を生成することを提案した。文章に従って重みを決定した。したがって,埋込み空間を柔軟に強調できる。ベンチマークデータセット上で文対ビデオ検索実験を行った。提案方法は優れた性能を達成して,結果は最先端の方法に競合する。これらの実験結果は,既存の方法と比較して,提案した多重埋込みアプローチの有効性を実証した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  人工知能  ,  図形・画像処理一般 

前のページに戻る