文献
J-GLOBAL ID:201502230990170872   整理番号:15A0472282

Tightly Coupled Acceleratorsアーキテクチャに基づくGPUクラスタの構築と性能予備評価

Development and Preliminary Evaluation of GPU Cluster Based on Tightly Coupled Accelerators Architecture
著者 (4件):
資料名:
巻:号:ページ: 14-25 (WEB ONLY)  発行年: 2013年10月30日 
JST資料番号: U0477A  ISSN: 1882-7829  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
GPUなどの演算加速装置を用いたクラスタがHPCシステム向けに広く使われている。しかしこのようなクラスタでは,ノード間をまたがる演算加速装置間の通信において,CPUを介した複数回のメモリコピーが必要であった。このレイテンシ増加はアプリケーション性能を著しく低下させる。そこで,筑波大学計算科学研究センターでは,大規模GPUクラスタであるHA-PACSとしてコモディティ技術による大規模GPUクラスタ部分に加え,ノード間接続およびGPU間接続に,レイテンシとバンド幅の改善を目指した独自開発の密結合並列演算加速機構TCA(Tightly Coupled Accelerators)の開発を行っている。本論文では,TCAを実現する通信機構PEACH2とその基本転送性能の評価について述べる。さらにTCAを用いたアプリケーションの予備評価として,隣接2ノード間のping-pong通信における性能を測定し,従来の通信機構と比較した。その結果,ノードをまたぐCPUメモリ間転送では,最小レイテンシは0.9μsを実現し,最大バンド幅は3.5GB/sと,理論ピークの96%の性能が得られた。ノードをまたぐGPUメモリ間転送においては,最小で2.3μsのレイテンシを実現し,短いメッセージ長ではCUDAによるノード内GPU間転送を超える性能を示した。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
専用演算制御装置 
引用文献 (20件):
もっと見る
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る