{{ $t("message.ADVERTISEMENT") }}
{{ $t("message.AD_EXPIRE_DATE") }}2021年06月
{{ $t("message.ADVERTISEMENT") }}
文献
J-GLOBAL ID:201702237151020958   整理番号:17A0903221

GPUクラスタ上における階層型行列計算の最適化

著者 (4件):
資料名:
巻: 2017  号: HPC-160  ページ: Vol.2017-HPC-160,No.14,1-8 (WEB ONLY)  発行年: 2017年07月19日
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
階層型行列は小さな密行列と低ランク近似行列から構成される行列である。密行列を階層型行列によって近似することで,大規模な計算をより少ないメモリ量で行うことが可能となる。しかし階層型行列を用いた計算は複雑であるため,最適化が求められている。我々はこれまで階層型行列を用いた境界要素法による静電場解析問題の実装と評価をマルチコアCPUやメニーコアプロセッサにて実施してきた。本稿では,階層型行列を係数行列に持つ線形方程式に対する反復法を対象として,GPUクラスタ上での性能評価や最適化に取り組んだ結果を示す。主要な計算部である階層型行列ベクトル積計算を構成する密行列ベクトル積計算をMAGMA BLASに行わせることで高速化を目指したところ,GPUカーネル起動のオーバーヘッドにより実行時間が増大したが,BATCHED MAGMAを用いることで大幅に性能が改善した。実験環境としてはTSUBAME2.5(最大8ノード/1ノードあたり1GPU)およびReedbush-H(最大8ノード/1ノードあたり1GPU)を使用し,それぞれ8ノードまで性能向上は得られたが,ノード数を増やした場合にはMPI処理の時間も目立ってきており,さらなる最適化が求められる結果となった。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
専用演算制御装置  ,  ディジタル計算機方式一般 
引用文献 (13件):
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る