GPUによる4倍精度BLASの実装と評価

椋木大地; 高橋大介

文献

J-GLOBAL ID：201002254993896130 整理番号：10A0093035

GPUによる4倍精度BLASの実装と評価

Implementation and Evaluation of Quadruple Precision BLAS on GPU

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=10A0093035&COPY=1") }}
このテーマを更に深掘りする（JDreamⅢへ） {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=10A0093035&from=J-GLOBAL&jstjournalNo=Z0031C") }}

著者 (2件)： ,
資料名：
巻： 2009 号： 4 ページ： ROMBUNNO.ARC-186,13 発行年： 2009年12月15日
JST資料番号： Z0031C ISSN： 2186-2583 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

本稿ではGPU(Graphics Processing Unit)で動作する4倍精度BLAS(Basic Linear Algebra Subprograms)の実装を行った。GPUはメモリ性能に対して演算性能が高く,性能を引き出すには演算密度の高いアプリケーションが求められる。我々は演算密度の高い処理として倍精度演算を組み合わせたDouble-Double型(DD型)の4倍精度演算と行列積に着目し,GPU向けの汎用計算開発環境であるCUDA(Compute Unified Device Architecture)を用いて,DD型4倍精度BLASを実装した。NVIDIA Tesla C1060における性能評価では,Intel Core i7 920上で実行したCPU向けのDD型4倍精度BLASであるMBLASと比較し,DD型4倍精度行列積(DDGEMM)で最大約30倍の性能を得た。(著者抄録)

, , , , , , , , , ,
, , ,

専用演算制御装置 , 数値計算

, ,

前のページに戻る