文献
J-GLOBAL ID:201302251405315472   整理番号:13A0873676

GPUにおける高速なCRS形式疎行列ベクトル積の実装

著者 (2件):
資料名:
巻: 2012  号:ページ: ROMBUNNO.HPC-138,NO.5  発行年: 2013年04月15日 
JST資料番号: Z0031C  ISSN: 2186-2583  資料種別: 逐次刊行物 (A)
記事区分: 短報  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
疎行列ベクトル積(SpMV)は科学技術計算において多用される重要な基本演算である。本稿ではGPUにおける高速なCRS形式SpMVの実装について報告する。GPUとしてNVIDIA社のKeplerアーキテクチャを対象とし,CUDA5.0環境において実装を行った。従来のFermiアーキテクチャまでのGPUを対象に提案されていた実装手法をベースに,Keplerアーキテクチャで新たにサポートされた機能や仕様変更を活用して,最適化を行った。KeplerアーキテクチャのTesla K20における性能評価では,CUDA5.0に付属のcuSPARSEにおけるCRS形式の倍精度SpMVルーチンに対して,200種類の行列において,平均で約1.86倍,177種類の行列で性能向上を達成した。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
専用演算制御装置  ,  数値計算 

前のページに戻る