抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
電子ビームにおける集団効果の正確なシミュレーションは,加速器物理学における最も挑戦的で計算的に解決困難な問題の一つである。より最近,研究者たちは,集団効果をモデル化より正確に電子ビーム動力学のGPU加速,高忠実度シミュレーションを開発した。が,シミュレーションが高濃度データ集約とメモリ。特に,シミュレーションの集団効果計算相におけるデータ依存性,不規則なメモリアクセスパターンと制御フローをGPU上での非合体メモリアクセスの大きな数をもたらした。これは全体的な性能をかなり劣化させる。さらに,並列シミュレーションは貧弱なデータ局所性を示した。これは,非合体メモリアクセスと共に,メモリ階層の非効率的な使用をもたらす。データ局所性を改善することにより,データの再利用を最大化するために局所性発見的方法を用いた新しいキャッシュを意識したアルゴリズムを提案した。さらに,提案アルゴリズムでは,スレッド間の作業負荷をバランスさせるための制御フローの発見的方法を用いた。制御フロー発見もスレッド発散を最小化し,これまでの反復の部分結果の再利用が可能になり,それによって全体的な演算数を減少させた。NVIDIA Tesla K40GPU上での実験結果により,提案アプローチでは,倍精度性能の最大450Gflops,最新GPU実装と比較して16倍のスピードアップへの変換をもたらすことを示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】