様々な計算機環境におけるOpenMP/OpenACCを用いたICCG法の性能評価

大島聡史; 松本正晴; 片桐孝洋; 塙敏博; 中島研吾

文献

J-GLOBAL ID：201502228675251916 整理番号：15A0337796

様々な計算機環境におけるOpenMP/OpenACCを用いたICCG法の性能評価

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=15A0337796&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=15A0337796&from=J-GLOBAL&jstjournalNo=U0451A") }}

著者 (5件)： , , , ,
資料名：
巻： 2014 号： HPC-145 ページ： VOL.2014-HPC-145,NO.21 (WEB ONLY) 発行年： 2014年07月21日
JST資料番号： U0451A 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

今日のHPCにおいては高い演算性能と低い消費電力を達成するために様々な並列計算ハードウェアが用いられている。CPUは微細化と消費電力の制限等によりマルチコア化が進み,現在では1ソケットあたり10前後のコアを搭載したCPUが多く用いられている。GPUは非常に多くの計算コアと高いピーク性能を備え,CPUと比べると適したアプリケーションが限られるものの,様々なシーンにおいて活用が進んでいる。メニーコアプロセッサはCPUとGPUそれぞれのメリットを享受できるものとして注目が高まっている。一方で並列計算のためのプログラミング環境に着目すると,従来から使われているOpenMPやMPIの普及がますます進んでいる。さらに近年では従来のOpenMPでは対応できなかったGPUプログラミングについてもOpenMPのような指示文を用いた簡便な並列化プログラミングを可能にするべく,OpenMP4.0やOpenACCが策定され,対応するコンパイラもいくつか公開・販売され始めている。そこで本稿では,様々な計算機環境を対象としてOpenMPやOpenACCを用いて同一の問題を実行し,性能やその傾向を調査し報告する。対象問題としては有限体積法アプリケーションにおけるICCG法を用いる。対象とする並列計算ハードウェアは以下の通りである:Intel Xeon(IvyBridge-EP),AMD Opteron(Piledriver),富士通SPARC64IXfx,NVIDIA Tesla(Kepler),Intel Xeon Phi(Knights Corner)。(著者抄録)

, , , , , , ,
, , ,

計算機網 , 計算機システム開発

引用文献 (8件)：

Intel Xeon Processor E5-2680 v2 http://ark.intel.com/ja/products/75277/
AMD Opteron Processor (Opteron 6386 SE) http://products.amd.com/en-us/OpteronCPUDetail.aspx?id=814
FX10 スーパーコンピューターシステム (Oakleaf-FX) website, http://www.cc.u-tokyo.ac.jp/system/fx10/
Intel Xeon Phi Coprocessor 5110P http://ark.intel.com/ja/products/71992
NVIDIA Tesla CPUs (Tesla K40) http://www.nvidia.com/object/tesla-servers.html

, , ,

前のページに戻る