抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
・本誌2023年Vol.42,No.3ではP3Dの前処理付きCG(Conjugate Gradient)法をOpenMPによって並列化する方法を解説したので,GPU(Graphics Processing Unit)におけるOpenACCによる並列化と比較。
・CPU向けの並列プログラミングモデルのOpenMPと同様に,プログラムに指示行を挿入することでGPUを用いた並列化を可能にするが,プログラマによるCPU-GPU間のデータ転送の記述が必要。
・NVIDIA GPUではCPUとGPUのメモリを1つのメモリのように扱うUnified Memoryを利用でき,前記データ転送をシステム側に委ねられるので,P3DのシングルGPU実行でオーバヘッドを考慮する必要がないことを確認。
・CPUからGPUに実行が遷移する場合にGPUカーネルの準備にかかる時間がオーバヘッドとなるので,CPUとGPUの非同期実行する実装による実行時間を示し,問題サイズが小さい場合の影響の大きさを確認。