文献
J-GLOBAL ID:201702229454487542   整理番号:17A0213283

GPUを用いた電子ビーム動力学のメモリ効率の良い並列シミュレーション【Powered by NICT】

Memory-Efficient Parallel Simulation of Electron Beam Dynamics Using GPUs
著者 (5件):
資料名:
巻: 2016  号: HiPC  ページ: 212-221  発行年: 2016年 
JST資料番号: W2441A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
電子ビームにおける集団効果の正確なシミュレーションは,加速器物理学における最も挑戦的で計算的に解決困難な問題の一つである。より最近,研究者たちは,集団効果をモデル化より正確に電子ビーム動力学のGPU加速,高忠実度シミュレーションを開発した。が,シミュレーションが高濃度データ集約とメモリ。特に,シミュレーションの集団効果計算相におけるデータ依存性,不規則なメモリアクセスパターンと制御フローをGPU上での非合体メモリアクセスの大きな数をもたらした。これは全体的な性能をかなり劣化させる。さらに,並列シミュレーションは貧弱なデータ局所性を示した。これは,非合体メモリアクセスと共に,メモリ階層の非効率的な使用をもたらす。データ局所性を改善することにより,データの再利用を最大化するために局所性発見的方法を用いた新しいキャッシュを意識したアルゴリズムを提案した。さらに,提案アルゴリズムでは,スレッド間の作業負荷をバランスさせるための制御フローの発見的方法を用いた。制御フロー発見もスレッド発散を最小化し,これまでの反復の部分結果の再利用が可能になり,それによって全体的な演算数を減少させた。NVIDIA Tesla K40GPU上での実験結果により,提案アプローチでは,倍精度性能の最大450Gflops,最新GPU実装と比較して16倍のスピードアップへの変換をもたらすことを示した。Copyright 2017 The Institute of Electrical and Electronics Engineers, Inc. All Rights reserved. Translated from English into Japanese by JST【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
制御方式  ,  記憶方式 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る