短距離古典分子動力学法の超並列計算に向けて

渡辺宙志

文献

J-GLOBAL ID：201202267936682468 整理番号：12A1320234

短距離古典分子動力学法の超並列計算に向けて

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=12A1320234&from=J-GLOBAL&jstjournalNo=L8101A") }}

著者 (1件)：
資料名：
巻： 14 号： 3 ページ： 122-125 発行年： 2012年07月31日
JST資料番号： L8101A ISSN： 1884-6750 資料種別：逐次刊行物 (A)
記事区分：解説発行国：日本 (JPN) 言語：日本語 (JA)

京コンピュータは1ノードに8コアのCPUを8万ノード以上束ねた構成をとり,それらを使いこなすには多層化に対応した計算コードを開発する必要がある。本論文では,短距離古典分子動力学法の大規模並列プログラムを組んだ経験を踏まえ,超並列計算への取り組み方を考察した。まず,シングルノードでこれ以上は性能が出ないことを確認する必要があり,並列化に適したデータの保存方法では100並列程度で性能が頭打ちになるのでゼロからプログラムを作り直すべきことを論じた。特に,キャッシュをうまく使えないと数~数十倍の計算速度を劣化させるので,プロファイラを利用して効率的にキャッシュを使えているかを調べたり,粒子数を増やしたときの粒子数あたりの性能変化を見るとよい。また,メモリ関連の最適化が済んだらプロダクトランの準備を行い,研究を進めながらCPUチューニングを行う方法が有効であり,SIMD(Single Instruction Multiple Data)化と条件分岐削除について説明した。さらに,1)Flat-MPI(Message Passing Interface)並列とMPI+OpenMLによるハイブリッド並列でのメモリ使用量の違い,2)MPIでの資源の枯渇,3)OS(Operating System)ジッタによる並列化効率の低下,4)プロダクトランに向けたプログラム改良の必要性を示した。

, , , , , , , , , , ,
, , ,

分子衝突・相互作用一般 , ディジタル計算機方式一般 , 計算機システム開発

引用文献 (2件)：

[1] H. Watanabe, M. Suzuki, and N. Ito, Prog. Theor. Phys. 126 203-235 (2011).
[2] http://mdacp.sourceforge.net/

前のページに戻る