抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
画像質問応答(IQA)は,コンピュータビジョンと自然言語処理分野における有望な学際的トピックとして出現した。本論文では,IQA問題を解決するために,文脈的に誘導された再帰的注意モデルを提案した。それは,深い強化学習に基づく多モード反復神経回路網である。構成文脈情報に基づいて,それは強化学習戦略を使用することを調査するために,現在,再決定した。伝統的な静的なソフトな注意とは異なり,IQAに対して意図的に強化された強化に基づいて,その目的が設計されている一種の動的注意として考えられる。最終的に学習された組成情報は,グローバルな文脈と局所的な情報の詳細の両方を組み込み,それは,回答を生成するのに有益であることを示す。提案した方法を,データセットMS COCOからのCOCO-QAとVQAを含む2つの公開IQAデータセットに関するいくつかの最先端の方法と比較した。実験結果は,著者らの提案モデルがそれらの方法より優れていて,より良い性能を達成することを実証した。Data from Wanfang. Translated by JST【JST・京大機械翻訳】