文献
J-GLOBAL ID:202202228667830311   整理番号:22A0884803

A64FXにおけるタスク並列ベンチマークの性能評価

著者 (4件):
資料名:
巻: 2022  号: HPC-183  ページ: Vol.2022-HPC-183,No.20,1-8 (WEB ONLY)  発行年: 2022年03月10日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年の主流であるメニーコアプロセッサにおいて,多数のコアを効率よく利用するためにタスク並列プログラミングモデルが注目されている.タスクに対してデータ依存を記述することで,従来のスレッド間の全体同期からタスク単位の同期とし,同期オーバヘッドを減らすことでプログラムの高速化が期待される.しかし,タスクに対してデータ依存を全て記述することや適切なタスク粒度を設定することは非常に困難であり,プログラム開発の生産性を低下させることから,我々はタスク並列で記述されたプログラムへの自動変換に関する研究開発を行っている.そこで本稿では,富士通が開発したメニーコアプロセッサであるA64FXにおいてタスク並列ベンチマークの実装や性能評価を行い,タスク並列プログラミングの現状や優位性を報告する.タスク並列プログラミングモデルをOpenMPとOmpSs-2とし,ベンチマークをLaplace Solver,N-body,ブロックコレスキー分解とした.実装では,OpenMP taskyield指示文の挙動がコンパイラにより異なるため,動作しないことを想定したデータ依存付きタスク並列実装を示した.性能評価では,既存のデータ並列実装と比較してLaplace Solverで16%,N-bodyで15%,ブロックコレスキー分解で42%の性能向上を確認し,タスク並列プログラミングモデルによる実装の性能の高さを示した.(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
数値計算 
引用文献 (14件):
  • Fujitsu Limited, A64FX(R) Microarchitecture Manual, https://github.com/fujitsu/A64FX/blob/master/doc/A64FX_Microarchitecture_Manual_jp_1.6.pdf, 2021.
  • D. Alejandro, A. Eduard, B. Rosa M, L. Jesus, M. Luis, M. Xavier, P. Judit, “OmpSs: A Proposal for Programming Heterogeneous Multi-Core Architectures”, Parallel Processing Letters, 2011, Vol. 21, pp. 173-193.
  • Programming Models Group BSC, OmpSs-2 Specification, https://pm.bsc.es/ftp/ompss-2/doc/spec/OmpSs-2-Specification.pdf, 2021.
  • oneAPI Specification 1.1-rev-1 documentation/oneTBB, https://spec.oneapi.io/versions/latest/elements/oneTBB/source/nested-index.html, 2021
  • T.-W. Huang, C.-X. Lin, G. Guo, M. Wong, “CppTaskflow: Fast Task-Based Parallel Programming Using Modern C++,” 2019 IEEE International Parallel and Distributed Processing Symposium (IPDPS), 2019, pp. 974-983.
もっと見る
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る