文献
J-GLOBAL ID:201702264123691319   整理番号:17A0903223

マルチコア計算機による高精度行列-行列積アルゴリズムの性能評価

著者 (6件):
資料名:
巻: 2017  号: HPC-160  ページ: Vol.2017-HPC-160,No.16,1-8 (WEB ONLY)  発行年: 2017年07月19日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
BLAS(Basic Linear Subprograms)は多くの線形計算で必須のものであるが,現在,計算結果の正確性の考慮がほとんどなされていない。一方,倍精度演算による精度を保証する高精度行列-行列積アルゴリズムが知られているが,先進計算機環境での性能評価が不十分である。そこで本発表では,高精度行列-行列積アルゴリズムを複数の実装方式でスレッド並列化し,実行速度と精度の観点から性能評価した結果を報告する。特に,演算の途中で密行列から疎行列になる特性を利用した「疎行列-密行列」方式について名古屋大学に設置されたFX100システムを用いて性能評価を行った。性能評価の結果,無誤差変換により入力行列が多数疎行列になる場合において,CRS形式による実装によるスレッド並列化方式の方が,従来の密行列演算による実装方式に対し,高精度行列-行列積ルーチン全体時間において最大で約1.8倍,カーネル時間で最大で約22倍の高速化が達成された。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
専用演算制御装置  ,  ディジタル計算機方式一般  ,  ディジタル計算機ハードウェア一般 
引用文献 (14件):

前のページに戻る