文献
J-GLOBAL ID:201502288404223324   整理番号:15A0447042

CUDAによるランダムスパース方程式求解の命令レベル並列性を用いた高速化手法

The Speed-up Method Solving Random-sparse Equations Using Instruction-level Parallelism by the CUDA
著者 (2件):
資料名:
巻:号:ページ: 10-17 (WEB ONLY)  発行年: 2014年01月22日 
JST資料番号: U0474A  ISSN: 1882-7802  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,CUDA GPUにおいて実非対称(ランダムスパース)な構造を持つ方程式の求解を高速化するために,スタティックスケジューリングによって抽出した命令レベル並列性を用いてベクトル命令を生成するアルゴリズムを提案する。従来より,ランダムスパース方程式求解には直接法が用いられている。直接法によるランダムスパース方程式の求解は,零要素を含む演算を省くことで効率良く実行できる。よって,CUDA GPU上で演算の効率を高めるためには,スタティックスケジューリングを用いて零演算を含まない演算のみを抽出しベクトル化する。本手法は,方程式を求解する際に実行可能であるという組合せの情報のみを抽出することで,ベクトル化する。しかし,従来のように実行可能であるという組合せの情報のみからベクトル化するだけでは,高い効率で計算ができない。スケジューリングする際に,依存関係以外の情報も考慮することでCUDA GPUで演算の高速化が期待できる。そこで本論文では,すべての演算の依存関係を用いてスタティックスケジューリングを行うことで同時に実行可能な演算を抽出し,ベクトル化する。本手法によるスケジューリングでは,同時に実行可能な命令のうち,依存関係を多く持つ演算から優先的にベクトル化することでCUDA GPUによる効率的な演算を可能にする。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
ディジタル計算機方式一般  ,  専用演算制御装置 
引用文献 (16件):
もっと見る

前のページに戻る