プレプリント
J-GLOBAL ID:202202200610456352   整理番号:21P0072230

不均衡データ集合最適化のための新しい再サンプリング技術【JST・京大機械翻訳】

A Novel Resampling Technique for Imbalanced Dataset Optimization
著者 (4件):
資料名:
発行年: 2020年12月30日  プレプリントサーバーでの情報更新日: 2020年12月30日
JST資料番号: O7000B  資料種別: プレプリント
記事区分: プレプリント  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
膨大な量のデータにもかかわらず,関心の特別な事象はまだ非常に稀である。まれなイベントの分類は, fraudent取引,マルウェアトラフィック解析,ネットワーク侵入検出などの多くのドメインで共通の問題である。様々なデータセットに関する機械学習手法を用いたマルウェア検出に対する多くの研究が開発されているが,MTA-KDD’19データセットだけは,日常ベースで悪意のあるトラヒックの代表的集合を更新する特殊性を持っている。この日更新はデータセットの付加価値であるが,RRw-OptimizationMTA-KDD’19が発生するクラス不均衡問題によりポテンシャルに翻訳される。安全,境界,希少および異常値の4種類の少数クラス例を考慮することにより,実データセットにおけるクラス分布の困難さを捉えた。本研究では,クラス不均衡問題を扱うため,Generative Silhouette Reサンプリング 1-Nearest Network(G1Nos)オーバーサンプリングアルゴリズムの二つのバージョンを開発した。G1Nosアルゴリズムの最初のモジュールは,不均衡度の臨界閾値を同定する係数ベースインスタンス選択シルエットを実行する。(ID),第2のモジュールは,SMOTE様オーバーサンプリングアルゴリズムを用いて合成サンプルを生成する。クラスのバランスは,使用したデータセットの2つのクラスの間の比率を再確立するために,著者らのG1Nosアルゴリズムによって実行した。実験結果は,著者らのオーバーサンプリングアルゴリズムが,考慮したすべての計量において,他の2つのSOTA方法論より良好に働くことを示した。【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
データ保護 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る