深層学習モデルのためのShapley加法的説明(SHAP)の安定性に対する背景データサイズの影響の経験的研究【JST・京大機械翻訳】

Yuan Han; Liu Mingxuan; Kang Lican; Miao Chenkui; Wu Ying

プレプリント

J-GLOBAL ID：202202215363593748 整理番号：22P0337562

深層学習モデルのためのShapley加法的説明(SHAP)の安定性に対する背景データサイズの影響の経験的研究【JST・京大機械翻訳】

An empirical study of the effect of background data size on the stability of SHapley Additive exPlanations (SHAP) for deep learning models

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2022年04月24日プレプリントサーバーでの情報更新日： 2023年04月09日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

今日,機械学習(ML)モデルが特定の推論を行う理由の解釈は,そのような推論の精度と同様に重要である。決定木のようないくつかのMLモデルは,人間によって直接理解できる固有の解釈性を持っている。しかし,人工ニューラルネットワーク(ANN)のような他のものは,演繹機構を明らかにする外部法に依存している。SHapley加法(SHAP)はそのような外部方法の1つであり,ANNsを解釈するときバックグラウンドデータセットを必要とする。一般的に,背景データセットは訓練データセットからランダムにサンプリングされたインスタンスから成る。しかし,サンプリングサイズとそのSHAPへの影響は未調査のままである。MIMIC-IIIデータセットに関する著者らの経験的研究において,著者らは,ランダムサンプリングから得た異なる背景データセットを使用するとき,2つのコア説明-SHAP値および可変ランキングが変動することを示し,ユーザがSHAPからのワンショット解釈を要求できないことを示した。このような変動はバックグラウンドデータセットサイズの増加とともに減少する。また,SHAP変数ランキングの安定性評価におけるU型を知って,SHAPが適度に重要なものと比べて,最も重要で最も重要な変数をランク付けするのに信頼性が高いことを示した。全体として,我々の結果は,バックグラウンドデータがSHAP結果にどのように影響するかを考慮し,バックグラウンドサンプルサイズが増加するにつれてSHAP安定性を改善した。【JST・京大機械翻訳】

, , , , , , , , , , , ,
, , , 【Automatic Indexing@JST】

人工知能

, , , , , , , ,

前のページに戻る