抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,CUDA GPUにおいて実非対称(ランダムスパース)な構造を持つ方程式の求解を高速化するために,スタティックスケジューリングによって抽出した命令レベル並列性を用いてベクトル命令を生成するアルゴリズムを提案する。従来より,ランダムスパース方程式求解には直接法が用いられている。直接法によるランダムスパース方程式の求解は,零要素を含む演算を省くことで効率良く実行できる。よって,CUDA GPU上で演算の効率を高めるためには,スタティックスケジューリングを用いて零演算を含まない演算のみを抽出しベクトル化する。本手法は,方程式を求解する際に実行可能であるという組合せの情報のみを抽出することで,ベクトル化する。しかし,従来のように実行可能であるという組合せの情報のみからベクトル化するだけでは,高い効率で計算ができない。スケジューリングする際に,依存関係以外の情報も考慮することでCUDA GPUで演算の高速化が期待できる。そこで本論文では,すべての演算の依存関係を用いてスタティックスケジューリングを行うことで同時に実行可能な演算を抽出し,ベクトル化する。本手法によるスケジューリングでは,同時に実行可能な命令のうち,依存関係を多く持つ演算から優先的にベクトル化することでCUDA GPUによる効率的な演算を可能にする。(著者抄録)