計算工学でのGPUコンピューティング  長崎大学大規模GPUクラスタによるN体問題とFMM

横田理央; 濱田剛

文献

J-GLOBAL ID：201002299514035464 整理番号：10A1145186

計算工学でのGPUコンピューティング長崎大学大規模GPUクラスタによるN体問題とFMM

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=10A1145186&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=10A1145186&from=J-GLOBAL&jstjournalNo=L5669A") }}

著者 (2件)： ,
資料名：
巻： 15 号： 4 ページ： 2416-2419,2397(1) 発行年： 2010年10月31日
JST資料番号： L5669A ISSN： 1341-7622 資料種別：逐次刊行物 (A)
記事区分：解説発行国：日本 (JPN) 言語：日本語 (JA)

N体問題では1つ1つの粒子と相互作用する粒子がN個あり,前記相互作用が完全に独立に計算できるのでO(N²)の直接計算がGPU(Graphics Processing Unit)上で高い演算性能を実現してきた。本論文では,遠方場を階層的に近似することで計算時間をO(N)に軽減できる高速多重極点解法(FMM)を解説し,長崎大学の大規模GPUクラスタDEGIMAへ実装して性能評価を試みた。まず,N=10³~10⁷の直接計算とFMMの計算時間をNVIDIA GTX295のうちの単一GPU,及びIntel Core i7 2.67GHzの1コアで比較したところ直接計算では300倍,FMMは30倍程度GPUの方が速くなった。また,Nが小さいとGPUの理論性能を引き出すことが難しく,その傾向はFMMでより顕著に表れた。次に,同様の問題を512GPUまで使って計算し,N=10⁸に固定してFMMのストロングスケーリングを測定した結果,O(N)のアルゴリズムによって128GPUまでのストロングスケーリングを実現できた。さらに,計算時間の内訳を示し,GPU上で処理された部分に大部分の時間がかかっているので,大規模GPUクラスタ向けアルゴリズムの改良が必要であることを論じた。

, , , , , , , , ,
, , , ,

専用演算制御装置 , 統計力学一般,多体問題 , 数値計算 , 計算理論

引用文献 (9件)：

HAMADA, T. The Chamomile Scheme : An Optimized Algorithm for N-body Simulations on Programmable Graphics Processing Units. arXiv : astro-ph/0703100v1. 2007
NYLAND, L. Fast N-body Simulation with CUDA. GPU Gems. 2007, 3, 677-695
BELLEMAN, R. G. High Performance Direct Gravitational N-body Simulations on Graphics Processing Units II : An Implementation in CUDA. New Astronomy. 2008, 13, 103-113
HAMADA, T. A Novel Multiple-walk Parallel Algorithm for the Barnes-Hut Treecode on GPUs-Towards Cost Effective, High Performance N-body Simulation. Com-puter Science-Research and Development. 2009, 1-11
GABUROV, E. Sapporo : A Way to Turn Your Graphics Cards into a GRAPE-6. New Astronomy. 2009, 14, 630-637

, , , ,

前のページに戻る

計算工学でのGPUコンピューティング 長崎大学大規模GPUクラスタによるN体問題とFMM

計算工学でのGPUコンピューティング長崎大学大規模GPUクラスタによるN体問題とFMM