文献
J-GLOBAL ID:201802231423615376   整理番号:18A1668789

GPGPUによる高精度行列-行列積アルゴリズムのためのBatched BLASを用いた実装方式の提案

著者 (5件):
資料名:
巻: 2018  号: HPC-165  ページ: Vol.2018-HPC-165,No.32,1-8 (WEB ONLY)  発行年: 2018年07月23日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
基本線形代数サブプログラムBLASは多くの線形計算で必須であるが,演算精度に関する考慮が不十分であることが多い。一方,倍精度演算による精度を保証する高精度行列-行列積アルゴリズムが知られている。また,複数のBLAS演算をまとめて実行することで演算効率を向上させる,Batched BLASという数値計算ライブラリが近年提案されている。本研究では,高精度行列-行列積アルゴリズムにBatched BLASを適用した実装方式を提案するとともに,演算の途中で密行列から疎行列になる特性を利用した「疎行列-密行列」実装方式の演算性能について,東京大学に設置されているReedbush-HシステムのGPU環境を利用して性能評価を行った。性能評価の結果,Batched BLASを適用することでCPU環境で最大58.9%,GPU環境で最大で25.7%まで実行時間が短縮された。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
数値計算 
引用文献 (12件):

前のページに戻る