抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
スパース一般行列-行列乗法(SpGEMM)は,代数的多重格子法またはグラフアルゴリズムのような前処理の重要なカーネルの一つである。SpGEMMの性能は,入力,出力両マトリックスにランダムメモリアクセスのために現在のプロセッサ上で非常に低かった。数と出力行列の非零要素のパターンとして,局所性を達成するために重要な,実行前に知られていない。SpGEMMの最新のGPU実装は,一時的な結果のための大量のメモリを必要とし,高速GPU機器メモリに対する計算可能なマトリックスサイズを制限している。は少量のメモリを必要とする高性能を達成する新しい高速SpGEMMアルゴリズムを提案した。出力行列におけるパターンと値の計算は,GPUのオンチップ共有メモリとハッシュテーブルを用いて最適化した。さらに,このアルゴリズムはGPU資源の利用を改善するために同時に走行する複数カーネルを発売。出力行列の各列の計算のためのカーネルは,非ゼロ要素の数に基づいて選択した。NVIDIAのPascal発生GPU上でのフロリダ大学の疎行列コレクションからのマトリックスを用いた性能評価により,提案アプローチが既存SpGEMMライブラリーと比較して二重精度単精度におけるx4までのスピードアップと×を達成することを示した。さらに,メモリ使用量は平均倍精度における単一精度の14.7%と10.9%減少し,計算することを大きなマトリックスを可能にした。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】