文献
J-GLOBAL ID:201702282228671999   整理番号:17A0690387

京コンピュータにおける2.5次元アルゴリズムを用いた分散並列行列積の実装と評価

著者 (2件):
資料名:
巻: 2017  号: HPC-159  ページ: Vol.2017-HPC-159,No.1,1-6 (WEB ONLY)  発行年: 2017年04月10日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
分散並列環境における行列積計算の通信削減手法として,2.5次元アルゴリズムが提案されている。本稿では2.5次元アルゴリズムを使用した倍精度の分散並列行列積(2.5D-PDGEMM)を実装し,京コンピュータにおいてその性能を分析した。2.5D-PDGEMMを利用するには行列データを3次元形状に分散する必要があるが,我々は2.5D-PDGEMMを従来型の2次元アルゴリズムを採用するPDGEMMの代用とすることを想定し,行列が2次元で分散されている状態に対して2.5次元アルゴリズムを実行する実装した。京コンピュータの16384ノード(131072コア)を使用した性能評価では,ScaLAPACKのPDGEMMルーチンを含む従来の2次元アルゴリズムによる実装と比べ,行列の再分散コストを考慮しても,我々の実装した2.5D-PDGEMMが高速となるケースがあり,2.5次元アルゴリズムがPDGEMMの強スケーリング性を改善するために有効であることが確認された。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
計算理論 
引用文献 (11件):
  • Blackford, L. S., Choi, J., Cleary, A., D’Azevedo, E., Demmel, J., Dhillon, I., Dongarra, J., Hammarling, S., Henry, G., Petitet, A., Stanley, K., Walker, D. and Whaley, R. C.: ScaLAPACK Users’ Guide, Society for Industrial and Applied Mathematics, Philadelphia, PA (1997).
  • Solomonik, E. and Demmel, J.: Communication-Optimal Parallel 2.5D Matrix Multiplication and LU Factorization Algorithms, pp. 90-109 (2011).
  • Georganas, E., Gonz?lez-Dom?nguez, J., Solomonik, E., Zheng, Y., Touri?o, J. and Yelick, K.: Communication Avoiding and Overlapping for Numerical Linear Algebra, Proceedings of the International Conference on High Performance Computing, Networking, Storage and Analysis, SC ’12, pp. 100:1-100:11 (2012).
  • Schatz, M., Poulson, J. and Geijn, R. V. D.: Parallel Matrix Multiplication: 2D and 3D, Flame Working Note #62 (2012).
  • Koanantakool, P., Azad, A., Bulu, A., Morozov, D., Oh, S. Y., Oliker, L. and Yelick, K.: Communication-Avoiding Parallel Sparse-Dense Matrix-Matrix Multiplication, 2016 IEEE International Parallel and Distributed Processing Symposium (IPDPS), pp. 842-853 (2016).
もっと見る

前のページに戻る