文献
J-GLOBAL ID:201702282228671999
整理番号:17A0690387
京コンピュータにおける2.5次元アルゴリズムを用いた分散並列行列積の実装と評価
-
出版者サイト
{{ this.onShowPLink() }}
複写サービスで全文入手
{{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A0690387©=1") }}
-
高度な検索・分析はJDreamⅢで
{{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A0690387&from=J-GLOBAL&jstjournalNo=U0451A") }}
著者 (2件):
,
資料名:
巻:
2017
号:
HPC-159
ページ:
Vol.2017-HPC-159,No.1,1-6 (WEB ONLY)
発行年:
2017年04月10日
JST資料番号:
U0451A
資料種別:
会議録 (C)
記事区分:
原著論文
発行国:
日本 (JPN)
言語:
日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
分散並列環境における行列積計算の通信削減手法として,2.5次元アルゴリズムが提案されている。本稿では2.5次元アルゴリズムを使用した倍精度の分散並列行列積(2.5D-PDGEMM)を実装し,京コンピュータにおいてその性能を分析した。2.5D-PDGEMMを利用するには行列データを3次元形状に分散する必要があるが,我々は2.5D-PDGEMMを従来型の2次元アルゴリズムを採用するPDGEMMの代用とすることを想定し,行列が2次元で分散されている状態に対して2.5次元アルゴリズムを実行する実装した。京コンピュータの16384ノード(131072コア)を使用した性能評価では,ScaLAPACKのPDGEMMルーチンを含む従来の2次元アルゴリズムによる実装と比べ,行列の再分散コストを考慮しても,我々の実装した2.5D-PDGEMMが高速となるケースがあり,2.5次元アルゴリズムがPDGEMMの強スケーリング性を改善するために有効であることが確認された。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
,
,
,
,
,
,
,
,
,
,
,
,
準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
,
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
計算理論
引用文献 (11件):
-
Blackford, L. S., Choi, J., Cleary, A., D’Azevedo, E., Demmel, J., Dhillon, I., Dongarra, J., Hammarling, S., Henry, G., Petitet, A., Stanley, K., Walker, D. and Whaley, R. C.: ScaLAPACK Users’ Guide, Society for Industrial and Applied Mathematics, Philadelphia, PA (1997).
-
Solomonik, E. and Demmel, J.: Communication-Optimal Parallel 2.5D Matrix Multiplication and LU Factorization Algorithms, pp. 90-109 (2011).
-
Georganas, E., Gonz?lez-Dom?nguez, J., Solomonik, E., Zheng, Y., Touri?o, J. and Yelick, K.: Communication Avoiding and Overlapping for Numerical Linear Algebra, Proceedings of the International Conference on High Performance Computing, Networking, Storage and Analysis, SC ’12, pp. 100:1-100:11 (2012).
-
Schatz, M., Poulson, J. and Geijn, R. V. D.: Parallel Matrix Multiplication: 2D and 3D, Flame Working Note #62 (2012).
-
Koanantakool, P., Azad, A., Bulu, A., Morozov, D., Oh, S. Y., Oliker, L. and Yelick, K.: Communication-Avoiding Parallel Sparse-Dense Matrix-Matrix Multiplication, 2016 IEEE International Parallel and Distributed Processing Symposium (IPDPS), pp. 842-853 (2016).
もっと見る
タイトルに関連する用語 (6件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです
,
,
,
,
,
前のページに戻る