文献
J-GLOBAL ID:202102270214490367   整理番号:21A3312489

参照表現理解とセグメンテーションのためのクロスモダリティシナジーネットワーク【JST・京大機械翻訳】

Cross-modality synergy network for referring expression comprehension and segmentation
著者 (8件):
資料名:
巻: 467  ページ: 99-114  発行年: 2022年 
JST資料番号: W0360A  ISSN: 0925-2312  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
表現理解とセグメンテーションは,自然言語表現に従って,画像における参照インスタンスを位置決めし,セグメンテーションすることを目的とする。しかしながら,既存の方法は視覚特徴学習のための視覚と言語モダリティの間の相互作用を無視する傾向があり,視覚と言語モダリティの間の相乗作用を確立することは,かなりの課題のままである。上記の問題に取り組むために,著者らは,2つのタスクを共同処理するために,新しいエンドツーエンドフレームワーク,クロスモダリティシンセージネットワーク(CMS-Net)を提案した。本研究では,画像と表現の両方に対するモーダル表現を学習するための注意意識表現学習モジュールを提案した。言語自己注意サブモジュールを,このモジュールで提案し,イントラモダリティ関係を利用して表現を学習して,言語誘導チャネル空間注意サブモジュールを導入して,言語誘導の下で言語意識視覚表現を得て,それは,このモデルが画像における異なった関連領域に対してより多くの注意を払って,バックグラウンド干渉を緩和するのを助ける。次に,著者らは,モダリティ融合のためのモード間関係を確立するために,交差モード相乗作用モジュールを設計した。特に,視覚特徴マップの各位置で言語ビジュアル類似性を得て,意味と空間次元の両方で2つのモダリティの間で相乗作用を達成した。さらに,マルチスケール特徴から重要な情報を集約するための選択的戦略を有するマルチスケール特徴融合モジュールを提案し,目標結果を与えた。4つの挑戦的なベンチマークに関する広範な実験を行い,著者らのフレームワークは最先端の方法に対して顕著な性能利得を達成した。Copyright 2021 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る