文献
J-GLOBAL ID:201702217423666526   整理番号:17A1398662

NVIDIA Pascal GPUのための高性能でメモリを節約するスパース一般的行列-行列乗算【Powered by NICT】

High-Performance and Memory-Saving Sparse General Matrix-Matrix Multiplication for NVIDIA Pascal GPU
著者 (3件):
資料名:
巻: 2017  号: ICPP  ページ: 101-110  発行年: 2017年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
スパース一般行列-行列乗法(SpGEMM)は,代数的多重格子法またはグラフアルゴリズムのような前処理の重要なカーネルの一つである。SpGEMMの性能は,入力,出力両マトリックスにランダムメモリアクセスのために現在のプロセッサ上で非常に低かった。数と出力行列の非零要素のパターンとして,局所性を達成するために重要な,実行前に知られていない。SpGEMMの最新のGPU実装は,一時的な結果のための大量のメモリを必要とし,高速GPU機器メモリに対する計算可能なマトリックスサイズを制限している。は少量のメモリを必要とする高性能を達成する新しい高速SpGEMMアルゴリズムを提案した。出力行列におけるパターンと値の計算は,GPUのオンチップ共有メモリとハッシュテーブルを用いて最適化した。さらに,このアルゴリズムはGPU資源の利用を改善するために同時に走行する複数カーネルを発売。出力行列の各列の計算のためのカーネルは,非ゼロ要素の数に基づいて選択した。NVIDIAのPascal発生GPU上でのフロリダ大学の疎行列コレクションからのマトリックスを用いた性能評価により,提案アプローチが既存SpGEMMライブラリーと比較して二重精度単精度におけるx4までのスピードアップと×を達成することを示した。さらに,メモリ使用量は平均倍精度における単一精度の14.7%と10.9%減少し,計算することを大きなマトリックスを可能にした。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  ディジタル計算機方式一般 

前のページに戻る