文献
J-GLOBAL ID:202002267570351297   整理番号:20A2085009

並列データ要約による一般解析言語上でのスケーラブルな機械学習【JST・京大機械翻訳】

Scalable Machine Learning on Popular Analytic Languages with Parallel Data Summarization
著者 (2件):
資料名:
巻: 12393  ページ: 269-284  発行年: 2020年 
JST資料番号: H0078D  ISSN: 0302-9743  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
機械学習はスケーラブル処理を必要とする。重要な加速機構はデータ要約であり,多くのモデルに対して正確で,その要約は少量のRAMを必要とする。本論文では,データ要約行列を一般化し,1つまたは複数の要約を生成し,従来の研究と比較して,より広いクラスのモデルの利点を得た。この解は,共有化アーキテクチャ上で,RやPythonのような一般的な言語において,大きなデータ分析における標準である。3つのフェーズで機械学習モデルを計算するアルゴリズムを導入する:フェーズ0前処理とデータを並列処理ノードに転送する。フェーズ1は,並列およびフェーズ2における1つまたは複数のデータ要約を計算し,そのようなデータセット要約に基づく1つのマシンにおけるモデルを計算する。キーイノベーションは,C++コードにおける要求ベクトルベクトル外部製品を評価し,高レベルプログラミング言語から簡単な関数呼出しを行う。フェーズ1は完全に並列であり,最後に簡単なバリア同期を必要とすることを示した。フェーズ2は逐次ボトルネックであるが,全体の時間にほとんど寄与しない。著者らは,C++でプログラムされた著者らの要約アルゴリズムによって,R言語におけるプロトタイプによる実験的評価を提示する。最初に,Rは,Spark(MLlibの利用,Scala関数と呼ぶ),および並列DBMS(SQLクエリー呼出しUDFと計算データ要約)を含む,同じモデルを計算する競合ビッグデータ分析システムより,より速く,より簡単であることを示した。次に,この並列解は,データセットサイズが大きくなると単一ノード処理よりも良くなることを示した。Copyright Springer Nature Switzerland AG 2020 Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
人工知能 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る