宇宙輻射輸送コードにおけるOpenCLによるFPGA演算加速最適化

藤田典久; 小林諒平; 小林諒平; 山口佳樹; 山口佳樹; 朴泰祐; 朴泰祐; 吉川耕司; 吉川耕司; 安部牧人; 梅村雅之; 梅村雅之

文献

J-GLOBAL ID：201902287465109373 整理番号：19A1925760

宇宙輻射輸送コードにおけるOpenCLによるFPGA演算加速最適化

Optimization on Astrophysical Radiative Transfer Code for FPGAs with OpenCL

出版者サイト {{ this.onShowPLink() }} 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=19A1925760&COPY=1") }}
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=19A1925760&from=J-GLOBAL&jstjournalNo=U0477A") }}

著者 (12件)： , , , , , , , , , , ,
資料名：
巻： 12 号： 3 ページ： 64-75 (WEB ONLY) 発行年： 2019年07月29日
JST資料番号： U0477A ISSN： 1882-7829 資料種別：逐次刊行物 (A)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

近年,High Performance Computing(HPC)におけるチャレンジの中の一つに,高い性能と低い消費電力を持つField Programmable Gate Array(FPGA)技術をどのようにして次世代のスーパーコンピュータに用いるかという問題がある.Graphics Processing Unit(GPU)がHPCにおけるアクセラレータとして最も広く用いられているが,均一な大量の並列計算が必要であり,これが性能上のボトルネックとなる場合がある.一方で,FPGAは再構成回路による柔軟さと効率さを持っており,様々な問題に適応できる可能性を持つ.しかしながら,ハードウェアの動作を記述することは複雑であり,アプリケーションの開発者がFPGA回路を実装することは容易ではない.近年のFPGAにおける開発環境の進歩により,OpenCL言語を用いた高位合成(HLS:High Level Synthesis)開発環境が一般的になってきている.我々のこれまでのOpenCLを用いたカーネル記述の経験より,FPGA向けにアプリケーション記述する際は“co-design”に基づくアグレッシブなプログラミング戦略が高い性能を達成するうえで必要であることが分かっている.本研究では,宇宙輻射輸送を解くプログラムで用いられているアルゴリズムであるAuthentic Radiation Transfer(ART)法をOpenCLで記述してFPGA向けに最適化を行う.OpenCLで記述されたアプリケーションに対してco-designに基づくFPGA向け最適化を適用し,CPU,GPU,FPGA間での性能比較を行った.マルチコアCPU実装と比べて最大4.9倍の高速化が達成され,GPU実装との比較ではGPUと同程度の性能を達成した.FPGA実装の性能はGPUと同程度であるが,FPGAの方が通信オーバヘッドはGPUと比べると小さく,並列計算を行う際の性能はGPUの性能を超えられると考えられることから,今後,並列FPGA計算の実装を行う予定である.(著者抄録)

, , , , , ,
, , , , ,

システムプログラミング一般

引用文献 (14件)：

Intel: Intel^® FPGA SDK for OpenCL^TM (online), available from https://www.intel.co.jp/content/www/jp/ja/software/programmable/sdk-for-opencl/overview.html.
XILINX: SDAccel 開発環境(オンライン),入手先 https://japan.xilinx.com/products/design-tools/software-zone/sdaccel.html.
Zohouri, H.R., Maruyama, N., Smith, A., Matsuda, M. and Matsuoka, S.: Evaluating and Optimizing OpenCL Kernels for High Performance Computing with FPGAs, Proc. International Conference for High Performance Computing, Networking, Storage and Analysis, SC ’16, pp.35:1-35:12, IEEE Press (2016) (online), available from http://dl.acm.org/citation.cfm?id=3014904.3014951 (2016).
Hill, K., Craciun, S., George, A. and Lam, H.: Comparative analysis of OpenCL vs. HDL with image-processing kernels on Stratix-V FPGA, 2015 IEEE 26th International Conference on Application-specific Systems, Architectures and Processors (ASAP), pp.189-193 (online), DOI: 10.1109/ASAP.2015.7245733 (2015).
Luo, Y., Wen, X., Yoshii, K., Ogrenci-Memik, S., Memik, G., Finkel, H. and Cappello, F.: Evaluating irregular memory access on OpenCL FPGA platforms: A case study with XSBench, 2017 27th International Conference on Field Programmable Logic and Applications (FPL), pp.1-4 (online), DOI: 10.23919/FPL.2017.8056827 (2017).

, , , , , ,

前のページに戻る