文献
J-GLOBAL ID:202002287052855121   整理番号:20A1001779

TPSPMV ManyCoreアーキテクチャのための2相大規模スパース行列ベクトル乗算カーネル【JST・京大機械翻訳】

tpSpMV: A two-phase large-scale sparse matrix-vector multiplication kernel for manycore architectures
著者 (11件):
資料名:
巻: 523  ページ: 279-295  発行年: 2020年 
JST資料番号: D0636A  ISSN: 0020-0255  CODEN: ISIJBC  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
スパース行列ベクトル乗算(SpMV)は,多くの大規模アプリケーションで広く使われている数値線形代数における重要なサブルーチンの一つである。並列化による圧縮スパース(CSR)フォーマットに基づくマルチコアおよびマンコアアーキテクチャにおけるSpMVの加速は,最も一般的な方向の一つである。しかしながら,並列CSRベースのSpMVの最適化には3つの主要な課題がある。(a)各計算ユニットの制限された局所メモリは,大規模なスパース行列の長い列に割り当てることによって圧倒される。(b)入力ベクトルへの不規則なアクセスは,高価なメモリアクセス待ち時間をもたらす。(C)スパースデータ構造は低帯域幅利用をもたらす。本論文では,3つの主要な困難を軽減するために,マルチコアおよびマンコアアーキテクチャのメモリ構造および計算アーキテクチャに基づいて,tpSpMVと呼ばれる2相大規模SpMVを提案した。最初に,計算スケール限界を克服するために,並列CSRベースSpMVを2つの分離フェーズに実行する,tpSpMVのための2相並列実行技術を提案した。第二に,高性能コンピューティングプラットフォームのアーキテクチャ的利点を利用し,高いメモリアクセス待ち時間の問題を軽減するために,二つのフェーズに対する局所メモリキャッシング技術を用いた適応分割法と並列化設計を提案した。第3に,帯域幅利用を改善し,tpSpMVの性能を最適化するために,データ削減,アラインメントメモリアクセス,およびパイプライン技術のようないくつかの最適化を設計した。Sunway TaihuLightスーパーコンピュータのSW26010CPUに関する実験結果は,tpSpMVが28.61のスピードアップを達成して,平均に関する最先端の研究の上で13.16%の性能改善をもたらすことを証明した。Copyright 2020 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
数値計算 

前のページに戻る