文献
J-GLOBAL ID:201502272741971630   整理番号:15A0472276

GPUスパコンにおける1億個のスカラー粒子計算の強スケーリングと動的負荷分散

Dynamic Load Balance and Strong Scaling of a Passive Scalar Computation for 160 Million Particles on a GPU Supercomputer
著者 (3件):
資料名:
巻:号:ページ: 82-93 (WEB ONLY)  発行年: 2013年09月25日 
JST資料番号: U0477A  ISSN: 1882-7829  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近接相互作用に基づく粒子法の大規模計算では,時間的に粒子の空間分布が大きく偏ることによるノード間の計算負荷の不均一や,ノード間の移動にともなうメモリの断片化が並列化実行性能を大きく低下させる。本論文では,メモリが階層的に分散するGPUスパコンにおいて,与えられた速度場に基づいて移動するパッシブ・スカラー粒子の計算を例題とし,分割した領域間の粒子数の不均一を定期的に解消する方法と,粒子の再整列によりメモリの断片化を解消する方法を提案し,両者を合わせて実行性能の大幅な向上を図る。隣接領域の境界を横切って移動する粒子をGPU上で探索する際,GPU計算に特化したアルゴリズムの提案と実装を行う。粒子の再整列は大きなオーバヘッドとなるため,再整列の最適回数を求めるためのモデルを提案する。GPU間の動的負荷分散と粒子の再整列を導入した実装を構築し,ベンチマーク問題に対する検証を64GPUを用いて行い負荷分散の効果を確認した。また,GPUスパコンTSUBAME2.0において1.6億個のパッシブ・スカラー粒子計算に対して良好な強スケーリングを得ることができ,負荷分散を用いない場合と比較して6倍以上の高速化を実現した。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
図形・画像処理一般  ,  ディジタル計算機方式一般 
引用文献 (22件):

前のページに戻る