プレプリント
J-GLOBAL ID:202202216008671254   整理番号:22P0330267

マルチモーダル画像検索のための確率的合成埋込み【JST・京大機械翻訳】

Probabilistic Compositional Embeddings for Multimodal Image Retrieval
著者 (3件):
資料名:
発行年: 2022年04月12日  プレプリントサーバーでの情報更新日: 2022年04月12日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
画像検索における既存の研究は,複数のクエリに一般化しない1つまたは2つのクエリ入力による検索画像をしばしば考慮する。本研究では,画像検索における多重多モードクエリを構成するためのより挑戦的なシナリオを検討した。任意の数の問い合わせ画像および(または)テキストを与えられた場合,著者らの目標は,複数のマルチモーダルクエリに指定された意味概念を含むターゲット画像を検索することである。様々な質問の意味論を柔軟に符号化できる情報埋込みを学習するために,新しいマルチモーダル確率的構成者(MPC)を提案した。特に,確率的埋込みとして入力画像とテキストをモデル化し,多重マルチモーダルクエリによる画像検索を容易にする確率的構成規則によりさらに構成できる。MS-COCOデータセットに基づく新しいベンチマークを提案し,多重画像と(または)マルチモーダル画像検索のためのテキストクエリを構成する様々なセットアップに関する著者らのモデルを評価した。ベルと whistのない場合,確率的モデル定式化は,任意の視覚および(または)テキストモダリティで与えられた異なる量の入力でクエリーを一般化する一方で,マルチモーダル画像検索に関する既存の関連手法よりも著しく優れていることを示す。コードはここで利用可能である:https://github.com/andreineculai/MPC。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る