文献
J-GLOBAL ID:201302245942552715   整理番号:13A0904651

GPUにおける3倍・4倍精度浮動小数点演算の実現と性能評価

Implementation and Evaluation of Triple and Quadruple Precision Floating-point Operations on GPUs
著者 (2件):
資料名:
巻: 2012  号:ページ: ROMBUNNO.KONPYUTINGUSHISUTEMU,VOL.6,NO.1,66-77  発行年: 2013年04月15日 
JST資料番号: L7379A  ISSN: 1882-7772  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文ではGPUにおいて3倍・4倍精度浮動小数点演算を実現し,線形計算への適用例としてLevel1-3の代表的なBLAS(Basic Linear Algebra Subprograms)ルーチンであるAXPY,GEMV,GEMMを実装して性能評価を行った結果を示す。4倍精度演算にはDouble-Double型(DD型)の4倍精度演算(DD演算)を用いた。一方で3倍精度演算として新たに,Double+Single型(D+S型)・Double+Int型(D+I型)の3倍精度フォーマットを提案し,内部の計算にDD演算を用いることで3倍精度演算を行う手法を実装した。NVIDIA Tesla M2090における性能評価では,3倍・4倍精度のAXPY・GEMVがメモリ律速となり,その実行時間はデータサイズに比例して,単精度ルーチンに対しておよそ3倍,4倍となることを示した。我々が提案した3倍精度演算は,3倍精度データに対するDD演算がメモリ律速となるケースにおいて,4倍精度演算に対する速度面での利点が主張できる。4倍精度は必要ないが倍精度では精度が不足する場合では,特にPCI Expressやネットワークの帯域が性能のボトルネックとなりやすいGPUクラスタ環境などで,4倍精度に対する3倍精度の有効性が期待できる。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
専用演算制御装置  ,  演算方式  ,  計算機システム開発 
引用文献 (22件):
  • [1] Hasegawa, H.: Utilizing the quadruple-precision floating-point arithmetic operation for the Krylov Subspace Methods, Proc. SIAM Conference on Applied Linear Algebra (LA03) (2003).
  • [2] IEEE: IEEE Standard for Floating-Point Arithmetic, IEEE Std 754-2008, pp.1-58 (2008).
  • [3] Dekker, T.J.: A Floating-Point Technique for Extend-ing the Available Precision, Numerische Mathematik, Vol.18, pp.224-242 (1971).
  • [4] Bailey, D.H.: QD (C++/Fortran-90 double-double and quad-double package), available from (http://crd.lbl.govrdhbailey/mpdist/).
  • [5] Li, X.S., Demmel, J.W., Bailey, D.H., Hida, Y., Iskandar, J., Kapur, A., Martin, M.C., Thompson, B., Tung, T. and Yoo, D.J.: XBLAS ・Extra Precise Basic Linear Algebra Subroutines, available from (http://www.netlib.org/xblas/).
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る