抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,High Performance Computing(HPC)におけるチャレンジの中の一つに,高い性能と低い消費電力を持つField Programmable Gate Array(FPGA)技術をどのようにして次世代のスーパーコンピュータに用いるかという問題がある.Graphics Processing Unit(GPU)がHPCにおけるアクセラレータとして最も広く用いられているが,均一な大量の並列計算が必要であり,これが性能上のボトルネックとなる場合がある.一方で,FPGAは再構成回路による柔軟さと効率さを持っており,様々な問題に適応できる可能性を持つ.しかしながら,ハードウェアの動作を記述することは複雑であり,アプリケーションの開発者がFPGA回路を実装することは容易ではない.近年のFPGAにおける開発環境の進歩により,OpenCL言語を用いた高位合成(HLS:High Level Synthesis)開発環境が一般的になってきている.我々のこれまでのOpenCLを用いたカーネル記述の経験より,FPGA向けにアプリケーション記述する際は“co-design”に基づくアグレッシブなプログラミング戦略が高い性能を達成するうえで必要であることが分かっている.本研究では,宇宙輻射輸送を解くプログラムで用いられているアルゴリズムであるAuthentic Radiation Transfer(ART)法をOpenCLで記述してFPGA向けに最適化を行う.OpenCLで記述されたアプリケーションに対してco-designに基づくFPGA向け最適化を適用し,CPU,GPU,FPGA間での性能比較を行った.マルチコアCPU実装と比べて最大4.9倍の高速化が達成され,GPU実装との比較ではGPUと同程度の性能を達成した.FPGA実装の性能はGPUと同程度であるが,FPGAの方が通信オーバヘッドはGPUと比べると小さく,並列計算を行う際の性能はGPUの性能を超えられると考えられることから,今後,並列FPGA計算の実装を行う予定である.(著者抄録)