抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
MLは複雑な現実世界シナリオで展開され,そこでは誤差が影響が大きい結果である。これらのシステムでは,MLパイプラインの徹底的な試験が重要である。ML配置パイプラインの鍵成分は,ラベル付き訓練データのキュレーションである。ML文献における共通の実践は,ラベルがグランドトルースであると仮定する。しかし,大きな自律車両開発センターの経験では,ベンダーが誤りラベルをしばしば提供でき,訓練されたモデルで下流安全リスクをもたらすことができることを見出した。これらの問題に取り組むために,新しい抽象化,学習された観測の主張を提案し,それをFixyと呼ばれるシステムに実装した。Fixyは,既存の(おそらく雑音の多い)ラベル付きデータセットまたは以前に訓練されたMLモデルのような既存の組織資源を,人間またはモデル生成ラベルの誤りを見つける確率モデルを学習するために,既存の組織資源を活用する。ユーザ提供特徴およびこれらの既存の資源を考えると,Fixyは,ありそうでそうでない値(例えば30mphのスピードはそうでないが,300mphはそうでない)を指定する特徴分布を学習する。次に,これらの特徴分布を用いて,潜在的誤差に対するラベルをスコア化した。著者らは,FIxyが,不確実性サンプリングのようなモデルアサーションと標準技術に関する最近の研究と比較して,2×より高い精度を有する実際のデータセットにおける潜在的誤差を自動的にランク付けできることを示した。【JST・京大機械翻訳】