抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
データ駆動アルゴリズムは,データセット,特に社会的データが,しばしば少数度を表現できないのに対して,それらが動作するデータと同じくらい良い。データの表現Biasは,データ取得と調製方法において,歴史的識別から選択とサンプリングバイアスまでの様々な理由により起こる。「バイアス,バイアスアウト」は,表現バイアスのような問題に対処することなく,社会的応用に対する公平な結果を持つAIベースの解決策を期待できない。いくつかのレビュー論文を含む機械学習モデルにおける公平性の広範囲な研究があるが,データのバイアスは,あまり研究されていない。本論文では,データ集合の特徴として表現バイアスを同定し,解決する文献をレビューし,その後消費された方法に無関係である。この調査の範囲は構造化(タブリック)と非構造化(例えば,画像,テキスト,グラフ)データに有界である。多重設計次元に基づく研究技術を分類し,それらの特性のサイドバイサイド比較を提供する。データにおける表現バイアス問題を完全に扱う長い方法がある。著者らは,この調査が,それぞれのドメイン内の既存の研究を観察することによって,将来においてこれらの課題にアプローチする研究者を動機づけることを期待する。【JST・京大機械翻訳】