抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
今日のHPCにおいては高い演算性能と低い消費電力を達成するために様々な並列計算ハードウェアが用いられている。CPUは微細化と消費電力の制限等によりマルチコア化が進み,現在では1ソケットあたり10前後のコアを搭載したCPUが多く用いられている。GPUは非常に多くの計算コアと高いピーク性能を備え,CPUと比べると適したアプリケーションが限られるものの,様々なシーンにおいて活用が進んでいる。メニーコアプロセッサはCPUとGPUそれぞれのメリットを享受できるものとして注目が高まっている。一方で並列計算のためのプログラミング環境に着目すると,従来から使われているOpenMPやMPIの普及がますます進んでいる。さらに近年では従来のOpenMPでは対応できなかったGPUプログラミングについてもOpenMPのような指示文を用いた簡便な並列化プログラミングを可能にするべく,OpenMP4.0やOpenACCが策定され,対応するコンパイラもいくつか公開・販売され始めている。そこで本稿では,様々な計算機環境を対象としてOpenMPやOpenACCを用いて同一の問題を実行し,性能やその傾向を調査し報告する。対象問題としては有限体積法アプリケーションにおけるICCG法を用いる。対象とする並列計算ハードウェアは以下の通りである:Intel Xeon(IvyBridge-EP),AMD Opteron(Piledriver),富士通SPARC64IXfx,NVIDIA Tesla(Kepler),Intel Xeon Phi(Knights Corner)。(著者抄録)