抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
以前の少数ショット学習(FSL)は,一般的に一般的な概念とカテゴリーの自然画像に限定される。これらの研究は,ソースとターゲットクラスの間の非常に高い視覚類似性を仮定する。対照的に,最近提案されたクロスドメイン少数ショット学習(CD-FSL)は,少数のラベル付き例のみの新しいドメイン特異的ターゲットカテゴリーに,多くのラベル付き事例の一般的な自然画像から知識を転送することを目指している。CD-FSLの鍵となる課題は,ソースとターゲットドメインの間の巨大なデータシフトにあり,それは典型的には全体的に異なる視覚スタイルの形態である。これは,CD-FSLタスクに取り組むための古典的FSL法を直接拡張するのに非常に自明でない。この目的のために,本論文は,ソースデータセットのスタイル分布をスパニングすることによって,CD-FSLの問題を研究した。特に,ウェーブレット変換を導入して,形状やスタイルや高周波成分,例えばテクスチャのような低周波成分への視覚表現の分解を可能にした。このモデルを視覚スタイルにロバストにするために,ソース画像を互いにそれらの低周波成分のスタイルを交換することによって拡張する。このアイデアを実装するために,新しいStyle Augmentation(StyleAug)モジュールを提案した。さらに,スタイル増強画像の予測を確実にするための自己監視学習(SSL)モジュールを,不変のものと意味的に類似した。これはスタイルの交換における潜在的意味ドリフト問題を回避する。2つのCD-FSLベンチマークに関する大規模な実験は,著者らの方法の有効性を示した。著者らのコードとモデルを解放する。【JST・京大機械翻訳】