文献
J-GLOBAL ID:201902267828060535   整理番号:19A1929161

都市気象コードCity-LESの並列GPU実装の最適化と性能評価

著者 (9件):
資料名:
巻: 2019  号: HPC-170  ページ: Vol.2019-HPC-170,No.39,1-8 (WEB ONLY)  発行年: 2019年07月17日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
今日のHPCシステムでは,GPU等のアクセラレータを用いて計算性能を向上させるのが一つの主流になっている.GPUは高いメモリバンド幅と並列計算能力を持ち,定型的な計算を行うメモリバンド幅律速なHPCワークロードに適したアクセラレータである.我々は,CPUアプリケーションとして開発されてきた都市気象コードCity-LES(Large Eddy Simulation)のGPU化によってシミュレーションの高速化を行っている.元コードのLESにおける主要な計算は,3次元ステンシル計算をOpenMP+MPIで並列化しているが,支配的な複数の関数をGPU化することで,GPU実行に適していると思われる関数群では,関数単体実行で2GPU実行では2CPU(28コア)実行時の5.7倍から12.4倍に高速化でき,4GPU実行では4CPU(56コア)実行時の5.5倍から12.5倍の性能を達成することができた.また,全体実行では2GPU実行で2CPU実行に対して2.97倍,4GPU実行では4CPU実行の2.78倍の高速化を達成し,さらにGPU化を進めてフルGPU化を達成できれば2GPUで2CPUに対して3.8倍,4GPUで4CPUに対して3.5倍高速化できると予測している.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
ディジタル計算機ハードウェア一般  ,  局地循環,気流 
引用文献 (15件):
もっと見る

前のページに戻る