抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
現在の半教師つき学習(SSL)法は,ラベル付きおよびラベルなしデータセットの両者において,各クラスに対して利用可能なデータポイントの数間のバランスを仮定している。しかし,ほとんどの実世界データセットにクラス不均衡が存在する。そのような不均衡データセットに関する訓練モデルは偏ったモデルを導き,より頻繁なクラスに向けて偏った予測を導く。この問題は,訓練中の擬似ラベル(ラベルなしデータ)を得るために,このバイアスモデルを使用するので,SSL法においてさらに顕著である。本論文では,不偏性モデルをもたらすSSLに対するバランスラベル付きデータセットの選択を試みた。残念なことに,1ショットにおけるクラス不均衡分布からバランスのとれたラベル付きデータセットを得ることは挑戦的である。アクティブ学習ループにおけるバランスデータセットを徐々に選択するために,サブモジュール型相互情報(SMI)関数を最適化する新しいアルゴリズムであるBASIL(Balanced Active Semi-SupervIsed Learning)を提案した。重要なことに,この技術はSSL法の性能を改善するために効率的に使用できる。広範囲のSSL法に対するPath-MNISTとOrgan-MNISTの医学データセットに関する著者らの実験は,Basilの有効性を示した。さらに,Basilは,SMI関数が,よりバランスの取れたデータセットを選択するので,最先端の多様性と不確実性に基づくアクティブ学習法より優れていることを観測した。【JST・京大機械翻訳】