抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
階層型行列は小さな密行列と低ランク近似行列から構成される行列である。密行列を階層型行列によって近似することで,大規模な計算をより少ないメモリ量で行うことが可能となる。しかし階層型行列を用いた計算は複雑であるため,最適化が求められている。我々はこれまで階層型行列を用いた境界要素法による静電場解析問題の実装と評価をマルチコアCPUやメニーコアプロセッサにて実施してきた。本稿では,階層型行列を係数行列に持つ線形方程式に対する反復法を対象として,GPUクラスタ上での性能評価や最適化に取り組んだ結果を示す。主要な計算部である階層型行列ベクトル積計算を構成する密行列ベクトル積計算をMAGMA BLASに行わせることで高速化を目指したところ,GPUカーネル起動のオーバーヘッドにより実行時間が増大したが,BATCHED MAGMAを用いることで大幅に性能が改善した。実験環境としてはTSUBAME2.5(最大8ノード/1ノードあたり1GPU)およびReedbush-H(最大8ノード/1ノードあたり1GPU)を使用し,それぞれ8ノードまで性能向上は得られたが,ノード数を増やした場合にはMPI処理の時間も目立ってきており,さらなる最適化が求められる結果となった。(著者抄録)