抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
京コンピュータは1ノードに8コアのCPUを8万ノード以上束ねた構成をとり,それらを使いこなすには多層化に対応した計算コードを開発する必要がある。本論文では,短距離古典分子動力学法の大規模並列プログラムを組んだ経験を踏まえ,超並列計算への取り組み方を考察した。まず,シングルノードでこれ以上は性能が出ないことを確認する必要があり,並列化に適したデータの保存方法では100並列程度で性能が頭打ちになるのでゼロからプログラムを作り直すべきことを論じた。特に,キャッシュをうまく使えないと数~数十倍の計算速度を劣化させるので,プロファイラを利用して効率的にキャッシュを使えているかを調べたり,粒子数を増やしたときの粒子数あたりの性能変化を見るとよい。また,メモリ関連の最適化が済んだらプロダクトランの準備を行い,研究を進めながらCPUチューニングを行う方法が有効であり,SIMD(Single Instruction Multiple Data)化と条件分岐削除について説明した。さらに,1)Flat-MPI(Message Passing Interface)並列とMPI+OpenMLによるハイブリッド並列でのメモリ使用量の違い,2)MPIでの資源の枯渇,3)OS(Operating System)ジッタによる並列化効率の低下,4)プロダクトランに向けたプログラム改良の必要性を示した。