文献
J-GLOBAL ID:202102211334818064   整理番号:21A1145616

欠損データによる学習【JST・京大機械翻訳】

Learning with Missing Data
著者 (4件):
資料名:
巻: 2020  号: Big Data  ページ: 5037-5045  発行年: 2020年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
多くの実世界データセットは欠測値を含み,不完全なデータセットによる学習はデータ科学者が直面する共通の課題である。欠測値を補償するための完全なアプローチがないので,インテリジェントな方法でのハンドリングは,ロバストなデータモデルを開発するために重要である。空のセルで列を削除することは,一般的に使用されるアプローチであり,このナイーブ法は,サンプルサイズの減少による大きな標準誤差による推定につながる可能性がある。一方,欠測記録は,より良いアプローチであるが,それは,潜在的にバイアス結果をバイアスできる,しばしば非現実的な特定の仮定に依存するので,大きな注意で使用されるべきである。本論文では,記録の数を最大化するために新しい greedy欲様アルゴリズムを提案した。アルゴリズムは,学習に使用できるカラム(特徴)の数を変えることによって,様々な最大サブセットを生成するために使用できる。それは,ナイーブ方法より多くの記録をサルベージして,それは,帰属によって誘発するバイアスを避けた。学習アルゴリズムは,人工データによるバイアスなしに実際のサブセットから学習できる。最後に,提案したアルゴリズムを事例研究に適用し,COVID-19オープン研究データセット(CORD-19)を,世界人工知能専門家への行動の呼称として,White Houseと主導研究グループの連携によって準備し,そして,高い優先度の科学的質問に答えた。このデータセットは欠測記録を含み,従って,この解析から得た最大サブセットは研究コミュニティによりさらに調査できる。Copyright 2021 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般 
タイトルに関連する用語 (2件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る