Wave-SAN:クロスドメイン少数ショット学習のためのウェーブレットベースのスタイル増強ネットワーク【JST・京大機械翻訳】

Fu Yuqian; Xie Yu; Fu Yanwei; Chen Jingjing; Jiang Yu-Gang

プレプリント

J-GLOBAL ID：202202216237128769 整理番号：22P0304306

Wave-SAN:クロスドメイン少数ショット学習のためのウェーブレットベースのスタイル増強ネットワーク【JST・京大機械翻訳】

Wave-SAN: Wavelet based Style Augmentation Network for Cross-Domain Few-Shot Learning

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2022年03月15日プレプリントサーバーでの情報更新日： 2022年03月15日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

以前の少数ショット学習(FSL)は,一般的に一般的な概念とカテゴリーの自然画像に限定される。これらの研究は,ソースとターゲットクラスの間の非常に高い視覚類似性を仮定する。対照的に,最近提案されたクロスドメイン少数ショット学習(CD-FSL)は,少数のラベル付き例のみの新しいドメイン特異的ターゲットカテゴリーに,多くのラベル付き事例の一般的な自然画像から知識を転送することを目指している。CD-FSLの鍵となる課題は,ソースとターゲットドメインの間の巨大なデータシフトにあり,それは典型的には全体的に異なる視覚スタイルの形態である。これは,CD-FSLタスクに取り組むための古典的FSL法を直接拡張するのに非常に自明でない。この目的のために,本論文は,ソースデータセットのスタイル分布をスパニングすることによって,CD-FSLの問題を研究した。特に,ウェーブレット変換を導入して,形状やスタイルや高周波成分,例えばテクスチャのような低周波成分への視覚表現の分解を可能にした。このモデルを視覚スタイルにロバストにするために,ソース画像を互いにそれらの低周波成分のスタイルを交換することによって拡張する。このアイデアを実装するために,新しいStyle Augmentation(StyleAug)モジュールを提案した。さらに,スタイル増強画像の予測を確実にするための自己監視学習(SSL)モジュールを,不変のものと意味的に類似した。これはスタイルの交換における潜在的意味ドリフト問題を回避する。2つのCD-FSLベンチマークに関する大規模な実験は,著者らの方法の有効性を示した。著者らのコードとモデルを解放する。【JST・京大機械翻訳】

, , , , , , , , , , , ,
, , , 【Automatic Indexing@JST】

人工知能 , パターン認識

, , , , , ,

前のページに戻る