POWER8+GPUプラットフォーム上でのOpenMP4×加速器モデルのためのコンパイラ最適化機会の探索【Powered by NICT】

Hayashi Akihiro; Shirako Jun; Tiotto Ettore; Ho Robert; Sarkar Vivek

文献

J-GLOBAL ID：201702236468957974 整理番号：17A0215419

POWER8+GPUプラットフォーム上でのOpenMP4×加速器モデルのためのコンパイラ最適化機会の探索【Powered by NICT】

Exploring Compiler Optimization Opportunities for the OpenMP 4.× Accelerator Model on a POWER8+GPU Platform

出版者サイト複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=17A0215419&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=17A0215419&from=J-GLOBAL&jstjournalNo=W2441A") }}

著者 (5件)： , , , ,
資料名：
巻： 2016 号： WACCPD ページ： 68-78 発行年： 2016年
JST資料番号： W2441A 資料種別：会議録 (C)
記事区分：原著論文発行国：アメリカ合衆国 (USA) 言語：英語 (EN)

GPUは,高性能計算のためのますます普及が,GPUプログラムの性能を最適化する一般的に時間がかかり,非自明なプロセスである。この複雑性は,CUDAとOpenCLのような標準的GPUプログラミングモデルの低抽象レベルに起因している:GPUの全能力を利用するためにプログラマは,低レベルの操作を調整するために必要である。ソフトウェアの生産性や可搬性の点で,より魅力的なアプローチは,並列アルゴリズムを表現するための高レベル抽象化を提供することにより,GPUプログラミングを容易にするであろう。OpenMPは指令ベース共有メモリ並列プログラミングモデルであり,長年の間広く用いられている。OpenMP4.0年以降,GPUプラットフォームは加速器計画法を用いたOpenMPの並列処理用高水準抽象を拡張することにより支持された。この拡張は,プログラマは標準C/C++またはFortran言語におけるGPUプログラムを書くことを可能にする,GPUアーキテクチャのあまりにも多くの詳細を露見させることなく。しかし,そのような高レベル並列プログラミング戦略は一般的にコンパイラに付加的なプログラム最適化,低レベルプログラミングモデルと完全に手同調コードよりも低い性能をもたらすを課した。高レベルGPUプログラムを作成し,最適化することによって潜在的な性能向上を研究するために,本論文では,1)IBM POWER8TMとNVIDIA Tesla GPUプラットフォーム上でのOpenMP4×ベンチマークのセットを評価し,2)IBMXLとclang/LLVMコンパイラによる手書きCUDAと自動的に生成されたGPUプログラムの間で同等の性能解析を行った。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】

, , , , , , , ,
, , , , , , 【Automatic Indexing@JST】

計算機システム開発 , 専用演算制御装置

, , , , ,

前のページに戻る