文献
J-GLOBAL ID:201802227931503530   整理番号:18A0265747

FPGAを用いた津波シミュレーション:スケーラビリティ解析のためのGPU,およびルーフライン・モデルを用いた性能比較【Powered by NICT】

FPGA-based tsunami simulation: Performance comparison with GPUs, and roofline model for scalability analysis
著者 (4件):
資料名:
巻: 106  ページ: 153-169  発行年: 2017年 
JST資料番号: D0613B  ISSN: 0743-7315  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: オランダ (NLD)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
MOST(方法の分裂津波)は,津波のシミュレーションのための浅水方程式(SWE)を解くために広く用いられている。本論文では,FPGAを用いた実用的な津波シミュレーションのためのMOSTの高性能で電力効率の良い計算を提示した。シミュレーションのためのカスタムハードウェアは,制約された帯域幅で性能を向上させるために深く配管のための流れ計算アーキテクチャに基づいている。ステンシルバッファと組み合わせた計算カーネルのストリーム処理要素(SPE)を設計した。さらに平行な内部パイプラインを用いた複数のSPEを実行することによって利用可能なハードウェア資源を利用する空間的および時間的並列性を持つSPEアレイアーキテクチャを導入した。Arria10FPGAを用いた我々のプロトタイプ実装は,FPGAベース設計は無次元化を導入することにより単一精度における実海洋深さデータと数値的に安定な津波シミュレーションを行うことを示した。SPEアレイの設計空間を探索し,単一パイプラインを持つ六カスケードSPEsの設計は383GFlopsの持続的性能とわずか7.2GB/sの帯域幅をもつ8.41GFlops/W当たりの出力性能を達成することを見出した。これら数はNVidiaテスラK20c GPUのそれよりも8.6及び17.2倍高く,単精度で同じ津波シミュレーションのための,それぞれ,AMD Radeon R9280X GPUの場合に比して1.7及び7.1倍高かった。さらに,与えられたFPGAのための性能劣化と可能な性能向上の要因を検討するために,SPEアレイを用いたストリーム計算のためのルーフラインモデルを提案した。モデルを用いて,来るべきStratix10GX2800FPGAは津波シミュレーションのための筆者らのSPEアレイアーキテクチャと最大で8.7TFlopsの持続性能を達成できることを推定した。Copyright 2018 Elsevier B.V., Amsterdam. All rights reserved. Translated from English into Japanese by JST.【Powered by NICT】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
ディジタル計算機方式一般 

前のページに戻る