プレプリント
J-GLOBAL ID:202202217225180532   整理番号:22P0312403

HardVis:アンダーサンプリングおよびオーバーサンプリング技法を用いたインスタンスの困難性を取り扱うためのビジュアル解析学【JST機械翻訳】

HardVis: Visual Analytics to Handle Instance Hardness Using Undersampling and Oversampling Techniques
著者 (3件):
資料名:
発行年: 2022年03月29日  プレプリントサーバーでの情報更新日: 2024年04月18日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
※このプレプリント論文は学術誌に掲載済みです。なお、学術誌掲載の際には一部内容が変更されている可能性があります。
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
機械学習(ML)の大きな進歩にもかかわらず,不均衡なデータでの訓練は,多くの実世界応用で課題を依然として提起する。この問題を解決するための一連の多様な技術の中で,サンプリングアルゴリズムは効率的な解と見なされている。しかし,この問題はより基本的であり,インスタンスの硬さの重要性を強調する多くの研究がある。この問題は,誤分類される可能性が高く,分類性能の悪さの根本原因として役立つ,不安全または潜在的にノイズのあるインスタンスを管理することの重要性に言及する。本論文では,不均衡な分類シナリオの中で主にインスタンスの硬度を取り扱うために設計されたビジュアル解析システムHardVisを提案した。提案システムは,データタイプの様々な分布を視覚的に比較するユーザを支援し,後にアクティブサンプリング手法の影響を受ける局所特性に基づくインスタンスのタイプを選択し,アンダーサンプリングあるいはオーバーサンプリング手法からのどの提案がMLモデルに有益であるかを検証する。さらに,特定のクラスを均一にアンダーサンプリング/オーバーサンプリングするよりもむしろ,ユーザは,すべてのクラスから訓練インスタンスを分類するのが容易かつ困難であることを発見し,サンプリングすることを可能にする。ユーザは,すべてのパラメータを決定するために異なる視点からデータの部分集合を探索することができ,一方,HardVisは,それらのステップの追跡を維持し,別々にテストセットにおけるモデルの予測性能を評価する。最終結果は,MLモデルの予測力を高めるバランスのとれたデータセットである。HardVisの有効性および有効性を,仮想利用シナリオおよび利用事例を用いて実証した。最後に,筆者らは筆者らがML専門家から受けたフィードバックに基づいて,筆者らのシステムがいかに有用であるかを調べた。【JST機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
人工知能  ,  パターン認識 

前のページに戻る