文献
J-GLOBAL ID:201802232306559578   整理番号:18A1890943

Volta世代のGPUにおける重力ツリーコードの性能評価

著者 (1件):
資料名:
巻: 2018  号: HPC-166  ページ: Vol.2018-HPC-166,No.6,1-9 (WEB ONLY)  発行年: 2018年09月20日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Fermi世代からPascal世代までのGPU向けの最適化がなされている重力ツリーコードGOTHICを,Volta世代のGPUであるTesla V100向けに移植し,その性能を評価した。Tesla V100を用いて性能を測定したところ,N=223=8388608粒子で表現したアンドロメダ銀河モデルの計算に要した時間はステップあたり3.3×10-2sであり,コンパイル時に-gencode arch=compute_60,code=sm_70を指定することで約1.2倍の性能向上が得られることが分かった。またPascal世代のGPUであるTesla P100と比較すると,1.4-2.2倍の高速化が達成されることが分かった。得られた2.2倍という速度向上率は単精度理論ピーク演算性能比である1.5よりも大きい。これは,Volta世代のGPUにおいて整数演算ユニットが単精度浮動小数点演算ユニットから独立したことによる性能向上だと考えられる。整数演算ユニットの独立によって整数演算と単精度浮動小数点演算の同時実行が可能となり,整数演算の実行時間が単精度浮動小数点演算の実行時間によって隠蔽されることで,理論ピーク演算性能比を越える速度向上率が実現され得る。Tesla V100上では最大N=25×220=26214400粒子の計算が実行でき,ステップあたりの実行時間は2.0×10-1sであった。得られた単精度演算性能は3.5TFlop/sであり,Tesla V100の単精度理論ピーク演算性能の22%にあたる。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
数値計算 
引用文献 (23件):
  • Barnes, J. and Hut, P.: A hierarchical O(N log N) forcecalculation algorithm, Nature, Vol. 324, pp. 446-449 (online), DOI: 10.1038/324446a0 (1986).
  • Bédorf, J., Gaburov, E., Fujii, M. S., Nitadori, K., Ishiyama, T. and Portegies Zwart, S.: 24.77 Pflops on a Gravitational Tree-Code to Simulate the Milky Way Galaxy with 18600 GPUs, ArXiv e-prints (2014).
  • Fardal, M. A., Guhathakurta, P., Babul, A. and McConnachie, A. W.: Investigating the Andromeda stream - III. A young shell system in M31, Monthly Notices of the Royal Astronomical Society, Vol. 380, pp. 15-32 (online), DOI: 10.1111/j.1365-2966.2007.11929.x (2007).
  • Gaburov, E., Bédorf, J. and Portegies Zwart, S.: Gravitational tree-code on graphics processing units: implementation in CUDA, Procedia Computer Science, volume 1, p. 1119-1127, Vol. 1, pp. 1119-1127 (online), DOI: 10.1016/j.procs.2010.04.124 (2010).
  • Geehan, J. J., Fardal, M. A., Babul, A. and Guhathakurta, P.: Investigating the Andromeda stream - I. Simple analytic bulge-disc-halo model for M31, Monthly Notices of the Royal Astronomical Society, Vol. 366, pp. 996-1011 (online), DOI: 10.1111/j.1365-2966.2005.09863.x (2006).
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る