文献
J-GLOBAL ID:202202225503345890   整理番号:22A0967976

Chebyshev型不等式によるk平均クラスタリングにおける異常値の自動検出とクラスタ数【JST・京大機械翻訳】

Automatic detection of outliers and the number of clusters in k-means clustering via Chebyshev-type inequalities
著者 (4件):
資料名:
巻: 34  号:ページ: 5939-5958  発行年: 2022年 
JST資料番号: W0703A  ISSN: 0941-0643  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
k平均クラスタリングの2つの重要な課題に取り組んだ。論文の第一部では,データセットが適切な数のクラスタ(k)で分割された場合,Dの1/9以上が標準偏差(2s.d.)を2倍超え,Dの4/9以上が標準偏差(1s.d.)(σ)を超え,そこではDがクラスタ重心に対する各点の距離を構成するベクトルであることを示した。この限界は,単一モード対称クラスタ(k平均Gauss仮定の一般化)を仮定する。論文の第2部では,非異常値は,Dの中央値からの絶対偏差の中央値の14.826倍より,そのクラスタ重心からさらにはならないことを示した。興味深いことに,Dはk-平均プロセスから既に利用可能である。第1の洞察は,k-平均アルゴリズム(自動k-平均と呼ぶ)を効率良く推定し,効率的にkを推定する。ポピュラーな技術とは異なり,我々の研究はkに対する探索範囲を供給する必要性を除去する。一方,実際のデータセットは理想的な分布からずれるので,1と2s.d.試験は異なるk推定をもたらす。両推定値は,有効下限と上限を構成する。したがって,提案アルゴリズムは,自動的に決定した狭い探索範囲を通して,既存の技術をスピードアップし,自動化するための一般的な方法を提供する。著者らは,一般的シルエットとギャップ統計技術(Auto-SilhouetteとAuto-Gap)の強化されたバージョンを提示することによってこれを実証した。自動異常値検出をk-平均に組み込むための第2の理論的洞察を適用した。異常値認識アルゴリズム(k-平均#と呼ぶ)は,異常値のない標準k平均と同一である。異常値の存在において,それは,異常値の数を供給するためにユーザに関するk-平均-回答が自動化される間,k-平均---本技法は,完全な自動化の困難さを,k-means-regardingの著者によって記述したパズルを解決し,それは未解決問題と考えられた。Copyright The Author(s), under exclusive licence to Springer-Verlag London Ltd., part of Springer Nature 2021 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 

前のページに戻る