抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ゼロショット学習(ZSL)は,見える意味論を持つデータの訓練に基づいて,画像意味論を認識できるモデルを学習することを目的とする。最近の研究では,抽出した視覚特徴を意味属性に関連付けるために,大域的画像特徴またはマイニング識別局所パッチ特徴を利用した。しかしながら,実際の属性相関領域に対するモデルを確実にするための必要なトップダウン誘導と意味アラインメントの欠如のため,これらの方法は,視覚モダリティと属性モダリティの間の有意な意味ギャップに遭遇し,それは,それらの予測を,意味のない意味で信頼できないものにする。この問題を解決するために,本論文では,ハイブリッドルーティング変圧器(HRT)と呼ばれる新しい変圧器符号器デコーダモデルを確立する。HRT符号器では,ボトムアップとトップダウン動的ルーティング経路の両方によって構築され,属性整列視覚特徴を生成するアクティブな注意を埋め込む。HRT復号器では,静的ルーティングを用いて,属性配列視覚特徴,対応する属性意味論,およびクラス属性ベクトル間の相関を計算し,最終クラスラベル予測を生成した。この設計は,提示した変圧器モデルを,1)トップダウンとボトムアップの注意経路と,2)動的と静的ルーティング経路,のハイブリッドにする。3つの広く使用されたベンチマークデータセット,すなわちCUB,SUN,およびAWA2に関する総合的実験を行った。得られた実験結果は提案した方法の有効性を示した。【JST・京大機械翻訳】