GPUにおける3倍・4倍精度浮動小数点演算の実現と性能評価

椋木大地; 高橋大介

文献

J-GLOBAL ID：201302245942552715 整理番号：13A0904651

GPUにおける3倍・4倍精度浮動小数点演算の実現と性能評価

Implementation and Evaluation of Triple and Quadruple Precision Floating-point Operations on GPUs

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=13A0904651&COPY=1") }}
このテーマを更に深掘りする（JDreamⅢへ） {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=13A0904651&from=J-GLOBAL&jstjournalNo=L7379A") }}

著者 (2件)： ,
資料名：
巻： 2012 号： 2 ページ： ROMBUNNO.KONPYUTINGUSHISUTEMU,VOL.6,NO.1,66-77 発行年： 2013年04月15日
JST資料番号： L7379A ISSN： 1882-7772 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

本論文ではGPUにおいて3倍・4倍精度浮動小数点演算を実現し,線形計算への適用例としてLevel1-3の代表的なBLAS(Basic Linear Algebra Subprograms)ルーチンであるAXPY,GEMV,GEMMを実装して性能評価を行った結果を示す。4倍精度演算にはDouble-Double型(DD型)の4倍精度演算(DD演算)を用いた。一方で3倍精度演算として新たに,Double+Single型(D+S型)・Double+Int型(D+I型)の3倍精度フォーマットを提案し,内部の計算にDD演算を用いることで3倍精度演算を行う手法を実装した。NVIDIA Tesla M2090における性能評価では,3倍・4倍精度のAXPY・GEMVがメモリ律速となり,その実行時間はデータサイズに比例して,単精度ルーチンに対しておよそ3倍,4倍となることを示した。我々が提案した3倍精度演算は,3倍精度データに対するDD演算がメモリ律速となるケースにおいて,4倍精度演算に対する速度面での利点が主張できる。4倍精度は必要ないが倍精度では精度が不足する場合では,特にPCI Expressやネットワークの帯域が性能のボトルネックとなりやすいGPUクラスタ環境などで,4倍精度に対する3倍精度の有効性が期待できる。(著者抄録)

, , , , , , , , , , ,
, ,

専用演算制御装置 , 演算方式 , 計算機システム開発

引用文献 (22件)：

[1] Hasegawa, H.: Utilizing the quadruple-precision floating-point arithmetic operation for the Krylov Subspace Methods, Proc. SIAM Conference on Applied Linear Algebra (LA03) (2003).
[2] IEEE: IEEE Standard for Floating-Point Arithmetic, IEEE Std 754-2008, pp.1-58 (2008).
[3] Dekker, T.J.: A Floating-Point Technique for Extend-ing the Available Precision, Numerische Mathematik, Vol.18, pp.224-242 (1971).
[4] Bailey, D.H.: QD (C++/Fortran-90 double-double and quad-double package), available from (http://crd.lbl.govrdhbailey/mpdist/).
[5] Li, X.S., Demmel, J.W., Bailey, D.H., Hida, Y., Iskandar, J., Kapur, A., Martin, M.C., Thompson, B., Tung, T. and Yoo, D.J.: XBLAS ・Extra Precise Basic Linear Algebra Subroutines, available from (http://www.netlib.org/xblas/).

, ,

前のページに戻る