文献
J-GLOBAL ID:202302297086521661   整理番号:23A2026838

CUDA Fortran+MIG+UVMを用いたBLR行列QR分解の大規模高速化

著者 (5件):
資料名:
巻: 2023  号: HPC-190  ページ: Vol.2023-HPC-190,No.14,1-8 (WEB ONLY)  発行年: 2023年07月27日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
CPUやGPUの演算性能の向上に対してメモリ容量やメモリ速度の向上が遅れている今日,行列を近似して計算を行う近似行列計算法への注目が高まっている.我々は近似行列の一種であるブロック低ランク(Block Low Rank,BLR)行列に対するQR分解(BLR-QR)に取り組んでいる.特にGPUを用いた高速なBLR-QRの実現を目指しており,既に過去の研究においてMulti-Instance GPU(MIG)を用いたBLR-QRの高速化に成功している.本稿ではその際に生じた幾つかの課題を解決するため,CUDA FortranとMIGとUnified Virtual Memory(UVM)を用いた実装を行い,性能を評価した.その結果,Fortran90プログラムに対してC/C++およびCUDA Cを使わずにGPU化を行うことができ,GPUに適しない小規模なGPUカーネルであってもMIGにより高性能を得ることが可能であり,UVMを使うことでGPUに収まらないメモリサイズでも容易に実行可能であることが確認できた.この実装(実行)方法はBLR-QR以外のアプリケーションにとっても有用であることが期待される.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
汎用プログラミング言語  ,  ディジタル計算機方式一般  ,  数値計算 
引用文献 (12件):
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る