画像質問応答のための文脈的に誘導された反復的注意を有する深いマルチモーダル強化ネットワーク【JST・京大機械翻訳】

文献

J-GLOBAL ID：201702227863774012 整理番号：17A1868314

画像質問応答のための文脈的に誘導された反復的注意を有する深いマルチモーダル強化ネットワーク【JST・京大機械翻訳】

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A1868314&COPY=1") }}
高度な検索・分析はJDreamⅢで

資料名：
巻： 32 号： 4 ページ： 738-748 発行年： 2017年
JST資料番号： W0182A ISSN： 1000-9000 CODEN： JCTEEM 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：中国 (CHN) 言語：英語 (EN)

画像質問応答(IQA)は,コンピュータビジョンと自然言語処理分野における有望な学際的トピックとして出現した。本論文では,IQA問題を解決するために,文脈的に誘導された再帰的注意モデルを提案した。それは,深い強化学習に基づく多モード反復神経回路網である。構成文脈情報に基づいて,それは強化学習戦略を使用することを調査するために,現在,再決定した。伝統的な静的なソフトな注意とは異なり,IQAに対して意図的に強化された強化に基づいて,その目的が設計されている一種の動的注意として考えられる。最終的に学習された組成情報は,グローバルな文脈と局所的な情報の詳細の両方を組み込み,それは,回答を生成するのに有益であることを示す。提案した方法を,データセットMS COCOからのCOCO-QAとVQAを含む2つの公開IQAデータセットに関するいくつかの最先端の方法と比較した。実験結果は,著者らの提案モデルがそれらの方法より優れていて,より良い性能を達成することを実証した。Data from Wanfang. Translated by JST【JST・京大機械翻訳】

, , , , , , ,
, , 【Automatic Indexing@JST】

人工知能 , パターン認識

, , , , , ,

前のページに戻る