抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,out-of-coreステンシル計算のための指令ベース時間的ブロッキングを実現することを目的として,著者らはOpenACC指令の拡張とグラフィックス処理ユニット(GPU)上のout-of-coreステンシル計算を加速できるソーストランスレータを示した。炉心外ステンシル計算をGPUメモリに格納された完全にできない大きなデータを検討した。OpenACCのようなコードが与えられたとき,大量のデータを分解する小さい塊,GPUメモリとCPUメモリ間のチャンクを交換するための必要なデータ転送オーバヘッドを隠蔽するパイプライン法の中で処理されるに提案トランスレータOpenACCコードを生成する。さらに,生成されたコードは,CPU-GPUデータ転送の量を最小化するため時間的ブロッキング法を最適化した。実験では,三ステンシル計算コードに提案したトランスレータを適用した。テスラK40GPU上でのout-of-core性能は73.4GFLOPS,これは炉内性能よりも13%だけ低いに達した。,指令ベースアプローチであるGPU上でのout-of-coreステンシル計算を容易にするために有用であると考えられる。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】