NVIDIA Pascal GPUのための高性能でメモリを節約するスパース一般的行列-行列乗算【Powered by NICT】

Nagasaka Yusuke; Nukada Akira; Matsuoka Satoshi

文献

J-GLOBAL ID：201702217423666526 整理番号：17A1398662

NVIDIA Pascal GPUのための高性能でメモリを節約するスパース一般的行列-行列乗算【Powered by NICT】

High-Performance and Memory-Saving Sparse General Matrix-Matrix Multiplication for NVIDIA Pascal GPU

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A1398662&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A1398662&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (3件)： , ,
資料名：
巻： 2017 号： ICPP ページ： 101-110 発行年： 2017年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

スパース一般行列-行列乗法(SpGEMM)は,代数的多重格子法またはグラフアルゴリズムのような前処理の重要なカーネルの一つである。SpGEMMの性能は,入力,出力両マトリックスにランダムメモリアクセスのために現在のプロセッサ上で非常に低かった。数と出力行列の非零要素のパターンとして,局所性を達成するために重要な,実行前に知られていない。SpGEMMの最新のGPU実装は,一時的な結果のための大量のメモリを必要とし,高速GPU機器メモリに対する計算可能なマトリックスサイズを制限している。は少量のメモリを必要とする高性能を達成する新しい高速SpGEMMアルゴリズムを提案した。出力行列におけるパターンと値の計算は,GPUのオンチップ共有メモリとハッシュテーブルを用いて最適化した。さらに,このアルゴリズムはGPU資源の利用を改善するために同時に走行する複数カーネルを発売。出力行列の各列の計算のためのカーネルは,非ゼロ要素の数に基づいて選択した。NVIDIAのPascal発生GPU上でのフロリダ大学の疎行列コレクションからのマトリックスを用いた性能評価により,提案アプローチが既存SpGEMMライブラリーと比較して二重精度単精度におけるx4までのスピードアップと×を達成することを示した。さらに,メモリ使用量は平均倍精度における単一精度の14.7%と10.9%減少し,計算することを大きなマトリックスを可能にした。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】

, , , , , , , , , , , ,
, , 【Automatic Indexing@JST】

図形・画像処理一般 , ディジタル計算機方式一般

, , , , ,

前のページに戻る