行列プロセッサ上でのレベル3BLASおよびLU分解

ZEKRI Ahmed S.; SEDUKHIN Stanislav G.

文献

J-GLOBAL ID：200902205248352518 整理番号：08A0254223

行列プロセッサ上でのレベル3BLASおよびLU分解

Level-3 BLAS and LU Factorization on a Matrix Processor

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=08A0254223&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=08A0254223&from=J-GLOBAL&jstjournalNo=Z0778A") }}

著者 (2件)： ,
資料名：
巻： 49 号： SIG2(ACS21) ページ： 37-52 発行年： 2008年03月15日
JST資料番号： Z0778A ISSN： 0387-5806 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：日本 (JPN) 言語：英語 (EN)

クロック周波数の増大がその物理限界に近づくに従って,性能向上に対する優れたアプローチは,科学,工学,信号処理アプリケーションにおける異なる負荷の処理を行うために,汎用プロセッサに対するコプロセッサとしてより多くのコアを統合して並列度を高める方式がある。本論文では,行列ベースカーネル加速化のために2Dトーラス行列ユニットの中で密結合されたb×bシンプルコアにより強化されたスカラーユニットから成る多数コア行列プロセッサモデルを提案した。データのロード/ストアーは,メモリと2つのスカラーおよび行列処理ユニット間でb×bブロックのデータを移動させる脱結合データアクセスユニットを用いて計算処理とオーバーラップさせる。行列ユニットの演算は主に,細粒度b×b行列乗算-加算(MMA)演算の処理を行う。ここでは,データのロード/ストアーのオーバーラップを実現するために,MMA演算として行列転置およびスキューイングを含むデータアラインメント演算の定式化を行った。提案行列プロセッサ上で2つの基本線形代数アルゴリズムを設計し評価した。これらアルゴリズムは,線形方程式系を解くときの主要ステップであるレベル3BLASカーネルであるGEMMと部分主軸を用いたLU分解である。GEMMカーネルに対し,FLOP/サイクルで計測された最大計算速度は,異なる行列サイズnとブロックサイズbに近づいた。比較的大きなnの値に対するLU分解の速度は,モデルパラメータに依存して最大速度の約50%~90%の範囲であった。全体として,解析的結果により,行列ベースアプリケーションの高速化に対しては行列ユニットの利用がメリットを持つことを示した。(翻訳著者抄録)

, , , , , , , , , ,
,

ディジタル計算機方式一般 , 専用演算制御装置 , 数値計算

引用文献 (29件)：

Williams, S., et al.: The potential of the cell processor for scientific computing, CF ’06: Proc.3rd conference on Computing frontiers, New York, NY, USA, pp. 9-20, ACM Press (2006).
Gustafson, J. L. and Greer, B. S.: A hardware accelerator for the Intel Math Kernel, White paper, ClearSpeed Technology Inc., at http://www.clearspeed.com (2006).
The Berkeley Intelligent RAM (IRAM) Project: http://iram.cs.berkeley.edu.
Lawson, C. L., Hanson, R. J., Kincaid, R. J. and Krogh, F. T.: Basic linear algebra subprograms for FORTRAN usage, ACM Trans. Math. Software, Vol.5, pp. 308-323(1979).
Dongarra, J. J., Croz, J. D., Hammarling, S. and Hanson, R. J.: An extended set of FORTRAN basic linear algebra subprograms, ACM Trans. Math. Software, Vol.14, pp. 1-17(1988).

, ,

前のページに戻る