データにおける表現Bias:同定と解決技術に関する調査【JST・京大機械翻訳】

Shahbazi Nima; Lin Yin; Asudeh Abolfazl; Jagadish H. V.

プレプリント

J-GLOBAL ID：202202214581120340 整理番号：22P0308502

データにおける表現Bias:同定と解決技術に関する調査【JST・京大機械翻訳】

Representation Bias in Data: A Survey on Identification and Resolution Techniques

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (4件)： , , ,
資料名：
発行年： 2022年03月22日プレプリントサーバーでの情報更新日： 2023年03月18日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。

データ駆動アルゴリズムは,データセット,特に社会的データが,しばしば少数度を表現できないのに対して,それらが動作するデータと同じくらい良い。データの表現Biasは,データ取得と調製方法において,歴史的識別から選択とサンプリングバイアスまでの様々な理由により起こる。「バイアス,バイアスアウト」は,表現バイアスのような問題に対処することなく,社会的応用に対する公平な結果を持つAIベースの解決策を期待できない。いくつかのレビュー論文を含む機械学習モデルにおける公平性の広範囲な研究があるが,データのバイアスは,あまり研究されていない。本論文では,データ集合の特徴として表現バイアスを同定し,解決する文献をレビューし,その後消費された方法に無関係である。この調査の範囲は構造化(タブリック)と非構造化(例えば,画像,テキスト,グラフ)データに有界である。多重設計次元に基づく研究技術を分類し,それらの特性のサイドバイサイド比較を提供する。データにおける表現バイアス問題を完全に扱う長い方法がある。著者らは,この調査が,それぞれのドメイン内の既存の研究を観察することによって,将来においてこれらの課題にアプローチする研究者を動機づけることを期待する。【JST・京大機械翻訳】

, , , , , , ,
, , 【Automatic Indexing@JST】

人工知能

, ,

前のページに戻る