文献
J-GLOBAL ID:202002241306452301   整理番号:20A2462539

フレーズ接地のためのクロスモダル・オムニ相互作用モデリング【JST・京大機械翻訳】

Cross-Modal Omni Interaction Modeling for Phrase Grounding
著者 (7件):
資料名:
号: MM ’20  ページ: 1725-1734  発行年: 2020年 
JST資料番号: D0698C  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Phrase接地は,自然言語仕様におけるフレーズによって記述されたオブジェクトを局所化することを目的とする。以前の研究は,テキストモダリティと視覚モダリティからの入力とモード内グローバルレベルのみの相互作用をモデル化し,その結果,正確で完全なコンテキスト情報を捉える能力を欠いている。本論文では,隣接相互作用モジュール,大域的相互作用モジュール,交差モード相互作用モジュールおよびマルチレベルアラインメントモジュールから成る,新しいクロスモーダルOmni相互作用ネットワーク(COIネット)を提案した。本手法は,マルチレベルマルチモーダル相互作用を通して画像領域とフレーズ間の複雑な空間と意味関係を定式化する。隣接領域間の相互作用を用いて局所関係を捉え,次に,変圧器符号器を用いて全領域間の相互作用を通して大域的文脈を収集した。さらに,すべての画像領域およびフレーズに対するクロスモーダルコンテキストを収集するために,2つのモダリティ間の相互作用を適用するために,共注意モジュールを使用した。全相互作用モデリングに加えて,全ての接地決定間の依存性を定式化するために,直接的ではあるが効果的なマルチレベルアラインメント正則化も利用した。著者らのモデルの有効性を広範囲に検証した。実験は,著者らのアプローチが,精度に関して,2つの一般的データセットに関する大きなマージンによって,既存の最先端の方法より優れていることを示した:Flickr30Kエンティティに関する6.15%(71.36%は77.51%まで増加),そして,ReferItゲーム(44.91%は66.16%まで増加した)に関して21.25%。この実装のコードはhttps://github.com/yiranyyu/Phrase-Groundingで利用可能である。Please refer to this article’s citation page on the publisher website for specific rights information. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
分子・遺伝情報処理  ,  生物学的機能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る