文献
J-GLOBAL ID:201802225013744135   整理番号:18A1890946

Level-3BLASに基づく高精度行列積計算法による高精度かつ再現性のあるBLASルーチンの実装とその最適化

著者 (3件):
資料名:
巻: 2018  号: HPC-166  ページ: Vol.2018-HPC-166,No.9,1-8 (WEB ONLY)  発行年: 2018年09月20日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
浮動小数点演算による丸め誤差は,計算結果の正しさ(accuracy)と再現性(reproducibility)に影響を与え,数値計算の信頼性を失わせる原因となりうる。そのため高精度かつ再現可能な演算をサポートした数値計算ライブラリの実現が求められている。本研究では基本線形代数演算を提供するBasic Linear Algebra Subprograms(BLAS)の内積(DOT),行列ベクトル積(GEMV),行列積ルーチン(GEMM)を,尾崎らが提案したlevel-3BLASに基づく高精度行列積計算法(尾崎スキーム)によって高精度かつ再現可能にする際の高性能実装手法を検討した。省メモリ化と高速化のためのいくつかの既提案手法に加え,本稿ではメモリ律速なDOT・GEMVを高速化するための新手法を検討し,NVIDIA GPUにおいて実装を行った。VoltaアーキテクチャのTitan Vにおける性能評価では,最適化手法を適用した実装が期待される理論性能の8割程度を達成できることを確認した。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
数値計算 
引用文献 (23件):
もっと見る

前のページに戻る