抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
N体問題では1つ1つの粒子と相互作用する粒子がN個あり,前記相互作用が完全に独立に計算できるのでO(N
2)の直接計算がGPU(Graphics Processing Unit)上で高い演算性能を実現してきた。本論文では,遠方場を階層的に近似することで計算時間をO(N)に軽減できる高速多重極点解法(FMM)を解説し,長崎大学の大規模GPUクラスタDEGIMAへ実装して性能評価を試みた。まず,N=10
3~10
7の直接計算とFMMの計算時間をNVIDIA GTX295のうちの単一GPU,及びIntel Core i7 2.67GHzの1コアで比較したところ直接計算では300倍,FMMは30倍程度GPUの方が速くなった。また,Nが小さいとGPUの理論性能を引き出すことが難しく,その傾向はFMMでより顕著に表れた。次に,同様の問題を512GPUまで使って計算し,N=10
8に固定してFMMのストロングスケーリングを測定した結果,O(N)のアルゴリズムによって128GPUまでのストロングスケーリングを実現できた。さらに,計算時間の内訳を示し,GPU上で処理された部分に大部分の時間がかかっているので,大規模GPUクラスタ向けアルゴリズムの改良が必要であることを論じた。