文献
J-GLOBAL ID:201502209143099055   整理番号:15A0780960

CUDA-BLAS等の選択による最速GPU固有値ソルバーの性能評価

著者 (7件):
資料名:
巻: 2015  号: HPC-148  ページ: VOL.2015-HPC-148,NO.4 (WEB ONLY)  発行年: 2015年02月23日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本研究では,既存の固有値計算で最速となるGPU固有値ソルバーに対してCUDA-BLASの選択による性能の違いを検証し,最速ソルバーの組み合わせを発見することを目的とした議論と実験を行う。論点として,既存のGPU固有値ソルバーEigen-G,MAGMAに対する分析とその内部で共通に使用されているCUDA-BLASの実装について最良の組み合わせを見つけ出すことを考える。本報告では,CUDA-BLASの実装には我々が開発を進めてきたASPEN.K2のdsymvが固有値ソルバーの性能に寄与し,MAGMA+ASPEN.K2の実装による更なる高性能化の一例を示す。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
ディジタル計算機方式一般  ,  専用演算制御装置 
引用文献 (18件):
  • Imamura, T., ASPEN-K2: Automatic-tuning and Stabilization for the Performance of CUDA BLAS Level 2 Kernels, 15th SIAM Conference on Parallel Processing for Scientific Computing (PP2012), http://www.siam.org/meetings/pp12/
  • 椋木大地,Keplerアーキテクチャ GPUにおける高速なSGEMVの実装,GTC Japan 2014.
  • NVIDIA Corporation, CUDA C Programming guide, http://docs.nvidia.com/cuda/pdf/CUDA_C_Programming_Guide.pdf(2014).
  • NVIDIA Corporation, The NVIDIA CUDA Basic Linear Algebra Subroutines, http://developer.nvidia.com/cublas
  • Innovative Computing Laboratory, University of Tennessee, Matrix Algebra on GPU and Multicore Architectures, http://icl.cs.utk.edu/magma
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る