学習観測アサーションによる知覚データにおけるラベルとモデル誤差の発見【JST・京大機械翻訳】

Kang Daniel; Arechiga Nikos; Pillai Sudeep; Bailis Peter; Zaharia Matei

プレプリント

J-GLOBAL ID：202202208431403085 整理番号：22P0274957

学習観測アサーションによる知覚データにおけるラベルとモデル誤差の発見【JST・京大機械翻訳】

Finding Label and Model Errors in Perception Data With Learned Observation Assertions

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで

この文献はプレプリントです。プレプリントについてはこちらをご確認ください。

著者 (5件)： , , , ,
資料名：
発行年： 2022年01月15日プレプリントサーバーでの情報更新日： 2022年01月15日
JST資料番号： O7000B 資料種別：プレプリント
記事区分：プレプリント発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

MLは複雑な現実世界シナリオで展開され,そこでは誤差が影響が大きい結果である。これらのシステムでは,MLパイプラインの徹底的な試験が重要である。ML配置パイプラインの鍵成分は,ラベル付き訓練データのキュレーションである。ML文献における共通の実践は,ラベルがグランドトルースであると仮定する。しかし,大きな自律車両開発センターの経験では,ベンダーが誤りラベルをしばしば提供でき,訓練されたモデルで下流安全リスクをもたらすことができることを見出した。これらの問題に取り組むために,新しい抽象化,学習された観測の主張を提案し,それをFixyと呼ばれるシステムに実装した。Fixyは,既存の(おそらく雑音の多い)ラベル付きデータセットまたは以前に訓練されたMLモデルのような既存の組織資源を,人間またはモデル生成ラベルの誤りを見つける確率モデルを学習するために,既存の組織資源を活用する。ユーザ提供特徴およびこれらの既存の資源を考えると,Fixyは,ありそうでそうでない値(例えば30mphのスピードはそうでないが,300mphはそうでない)を指定する特徴分布を学習する。次に,これらの特徴分布を用いて,潜在的誤差に対するラベルをスコア化した。著者らは,FIxyが,不確実性サンプリングのようなモデルアサーションと標準技術に関する最近の研究と比較して,2×より高い精度を有する実際のデータセットにおける潜在的誤差を自動的にランク付けできることを示した。【JST・京大機械翻訳】

, , , , , , , , ,
, , , , , 【Automatic Indexing@JST】

人工知能

, , , , , ,

前のページに戻る