文献
J-GLOBAL ID:201702266687809151   整理番号:17A0040629

密結合並列演算加速機構TCAにおける複数DMACの活用によるGPU対応GASNetの性能改善

著者 (6件):
資料名:
巻: 2016  号: HPC-156  ページ: Vol.2016-HPC-156,No.5,1-8 (WEB ONLY)  発行年: 2016年09月08日 
JST資料番号: U0451A  資料種別: 会議録 (C)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,GPUのような演算加速装置を用いたクラスタがHPC分野で多く用いられるようになってきている。筑波大学計算科学研究センターでは,ノードを跨ぐ演算加速装置間での直接通信を実現するために,密結合並列演算加速機構TCA(Tightly Coupled Accelerators)を提唱している。このTCAの実装としてPEACH2(PCI Express Adaptive Communication Hub version2)が開発されており,ノードを跨ぐGPU間での直接通信を行うことができる。しかしながら,TCA/PEACH2を利用するためには独自のAPIを用いる必要があり,プログラミングコストが高く,既存のアプリケーションの移植も容易ではないという問題がある。この問題を解決し,TCA/PEACH2を広く利用できるようにするために,我々はPGAS言語を対象とした通信ライブラリであるGASNetのGPU対応版の実装を行っている。PEACH2は4チャネルのDMAC(DMA Controller)が実装されているが,今までの実装ではそのうちの1チャネルしか利用されていなかった。そのため,本稿では複数チャネルのDMACを活用した転送による性能改善についての検討および実装を行う。その結果,有効な転送サイズの範囲は限られるが,1チャネルしか利用しない場合と比べて最大で1.4倍のバンド幅が得られた。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (3件):
分類
JSTが定めた文献の分類名称とコードです
専用演算制御装置  ,  計算機網  ,  計算機システム開発 
引用文献 (15件):
  • Top500 Supercomputer Sites, http://www.top500.org/.
  • 塙 敏博,児玉 祐悦,朴 泰祐,佐藤 三久:Tightly Coupled Accelerators アーキテクチャに基づくGPUクラスタの構築と性能予備評価,情報処理学会論文誌コンピューティングシステム(ACS),Vol.6,No.3,pp.14-25,2013.
  • GASNet Communication System,http://gasnet.lbl.gov/.
  • Unified Parallel C, http://upc.gwu.edu/.
  • Co-array Fortran, http://www.co-array.org/.
もっと見る

前のページに戻る